Keywords: dynamic content, web collections, web pages,
Summarization of Dynamic Content in Web Collections
UDC 004.75
The paper is devoted to a new research project aimed at generalizing the dynamic content of web pages. Much of the information on the web is lost due to the temporal nature of web documents. Thus, adapting generalization methods for web documents is a relevant task. The research aims to develop methods for summarizing the changing content, which is extracted from a collection of topic web pages that are related to each other, over certain time intervals. This paper focuses on the most prominent topics and concepts found in web collections that are retrospective. Due to the diversity of content, as well as changes in web content over time, it is necessary to apply methods that differ from the basic ones that are applied to documents that are static.
1. Allan J. Temporal Summaries of News Topics / J. Allan, R. Gupta, V. Khandelwal // SIGIR '01: Proceedings of the 24th annual international ACM SIGIR conference on Research and development in information retrieval. – New York, 2001. – P. 10-18.
2. Ларичев О.И. Системы поддержки принятия решений: современное состояние и перспективы развития / О.И. Ларичев, А.Б. Петровский // Итоги науки и техники. Теория вероятностей. Математическая статистика. Теоретическая кибернетика. – 1987. – Т. 21. – С. 131-164.
3. Большаков А.А. Разработка стенда для оценки применимости транспортных протоколов в задачах обработки потоковой информации для создания адаптивной системы преобразования данных / А.А. Большаков, И.В. Егоров, В.В. Лобанов, Д.В. Лачугин // Вестник Тамбовского государственного технического университета. – 2014. – Т. 20. – № 3. – С. 440-451.
4. Jatowt A. Web Page Summarization Using Dynamic Content / A. Jatowt, M. Ishizuka // WWW Alt. '04: Proceedings of the 13th international World Wide Web conference on Alternate track papers & posters. – New York, 2004. – P. 344-345.
5. Mani I. Advances in Automatic Text Summarization / I. Mani, M.T. Maybury. – Cambridge: MIT Press, 1999. – 434 p.
6. McKeown K.R. Tracking and Summarizing News on a Daily Basis with Columbia’s Newsblaster / K.R. McKeown, R. Barzilay, D. Evans, V. Hatzivassiloglou, J.L. Klavans, A. Nenkova, C. Sable, B. Schiffman, S. Sigelman // HLT '02: Proceedings of the Second International Conference on Human Language Technology Research. – San Francisco, 2002. – P. 280-285.
7. Radev D.R. NewsInEssence: A System for Domain-Independent, Real-Time News Clustering and Multi-Document Summarization / D.R. Radev, S. Blair-Goldensohn, Z. Zhang, R.S. Raghavan // HLT '01: Proceedings of the First International Conference on Human Language Technology Research. – Stroudsburg, 2001. – P. 1-4.
8. Salton G. Term-Weighting Approaches in Automatic Text Retrieval / G. Salton, C. Buckley // Information Processing & Management. – 1988. – Vol. 24. – No. 5. – P. 513-523.
9. Зайцев Д.Л. Формальное представление деятельности пользователей с выявлением информационно-значимых объектов / Д.Л. Зайцев, А.Н. Зеленина // Вестник Воронежского института высоких технологий. – 2021. – Т. 15. – № 2 (37). – С. 45-56.
10. Зайцев Д.Л. Классификация интерактивных взаимодействий пользователя с программным обеспечением / Д.Л. Зайцев, А.Н. Зеленина // Вестник Воронежского института высоких технологий. – 2022. – Т. 16. – № 3 (42). – С. 43-48.
Keywords: dynamic content, web collections, web pages,
For citation: Zaitsev D.L. , Zelenina A.N. , Stepchenkov A.D. , Summarization of Dynamic Content in Web Collections. Bulletin of the Voronezh Institute of High Technologies. 2024;18(2). Available from: https://vestnikvivt.ru/ru/journal/pdf?id=1321 (In Russ).
Received 04.06.2024
Revised 07.06.2024
Published 30.06.2024