Обобщение динамического контента в веб-коллекциях
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
НАУЧНЫЙ ЖУРНАЛ ВЕСТНИК ВОРОНЕЖСКОГО ИНСТИТУТА ВЫСОКИХ ТЕХНОЛОГИЙ
cетевое издание
ISSN 2949-4443

Обобщение динамического контента в веб-коллекциях

Зайцев Д.Л. ,  Зеленина А.Н. ,  Степченков А.Д.  

УДК 004.75

  • Аннотация
  • Список литературы
  • Об авторах

Статья посвящена новому исследовательскому проекту, направленному на обобщение динамического контента веб-страниц. Значительная часть информации в Интернете теряется из-за временной природы веб-документов. Таким образом, адаптация методов обобщения для веб-документов является актуальной задачей. Исследование нацелено на разработку методов обобщения изменяющегося контента, который извлечен из коллекции тематических веб-страниц, которые связаны между собой, за определенные промежутки времени. В данной статье рассматриваются наиболее известные тематики и концепции, обнаруженные в веб-коллекциях, которые являются ретроспективными. По причине разнообразия содержимого, а также изменений веб-контента, связанных со временем, необходимо применить методы, отличающиеся от базовых, которые применяются для документов, являющихся статическими.

1. Allan J. Temporal Summaries of News Topics / J. Allan, R. Gupta, V. Khandelwal // SIGIR '01: Proceedings of the 24th annual international ACM SIGIR conference on Research and development in information retrieval. – New York, 2001. – P. 10-18.

2. Ларичев О.И. Системы поддержки принятия решений: современное состояние и перспективы развития / О.И. Ларичев, А.Б. Петровский // Итоги науки и техники. Теория вероятностей. Математическая статистика. Теоретическая кибернетика. – 1987. – Т. 21. – С. 131-164.

3. Большаков А.А. Разработка стенда для оценки применимости транспортных протоколов в задачах обработки потоковой информации для создания адаптивной системы преобразования данных / А.А. Большаков, И.В. Егоров, В.В. Лобанов, Д.В. Лачугин // Вестник Тамбовского государственного технического университета. – 2014. – Т. 20. – № 3. – С. 440-451.

4. Jatowt A. Web Page Summarization Using Dynamic Content / A. Jatowt, M. Ishizuka // WWW Alt. '04: Proceedings of the 13th international World Wide Web conference on Alternate track papers & posters. – New York, 2004. – P. 344-345.

5. Mani I. Advances in Automatic Text Summarization / I. Mani, M.T. Maybury. – Cambridge: MIT Press, 1999. – 434 p.

6. McKeown K.R. Tracking and Summarizing News on a Daily Basis with Columbia’s Newsblaster / K.R. McKeown, R. Barzilay, D. Evans, V. Hatzivassiloglou, J.L. Klavans, A. Nenkova, C. Sable, B. Schiffman, S. Sigelman // HLT '02: Proceedings of the Second International Conference on Human Language Technology Research. – San Francisco, 2002. – P. 280-285.

7. Radev D.R. NewsInEssence: A System for Domain-Independent, Real-Time News Clustering and Multi-Document Summarization / D.R. Radev, S. Blair-Goldensohn, Z. Zhang, R.S. Raghavan // HLT '01: Proceedings of the First International Conference on Human Language Technology Research. – Stroudsburg, 2001. – P. 1-4.

8. Salton G. Term-Weighting Approaches in Automatic Text Retrieval / G. Salton, C. Buckley // Information Processing & Management. – 1988. – Vol. 24. – No. 5. – P. 513-523.

9. Зайцев Д.Л. Формальное представление деятельности пользователей с выявлением информационно-значимых объектов / Д.Л. Зайцев, А.Н. Зеленина // Вестник Воронежского института высоких технологий. – 2021. – Т. 15. – № 2 (37). – С. 45-56.

10. Зайцев Д.Л. Классификация интерактивных взаимодействий пользователя с программным обеспечением / Д.Л. Зайцев, А.Н. Зеленина // Вестник Воронежского института высоких технологий. – 2022. – Т. 16. – № 3 (42). – С. 43-48.

Зайцев Даниил Леонидович

Воронежский институт высоких технологий

Воронеж, Россия

Зеленина Анна Николаевна
кандидат технических наук, доцент

Воронежский институт высоких технологий

Воронеж, Россия

Степченков Андрей Дмитриевич

Воронежский институт высоких технологий

Воронеж, Россия

Ключевые слова: динамический контент, веб-коллекции, веб-страницы,

Для цитирования: Зайцев Д.Л. , Зеленина А.Н. , Степченков А.Д. , Обобщение динамического контента в веб-коллекциях. Вестник Воронежского института высоких технологий. 2024;18(2). Доступно по: https://vestnikvivt.ru/ru/journal/pdf?id=1321

57

Полный текст статьи в PDF

Поступила в редакцию 04.06.2024

Поступила после рецензирования 07.06.2024

Опубликована 30.06.2024