Ключевые слова: динамический контент, веб-коллекции, веб-страницы,
Обобщение динамического контента в веб-коллекциях
УДК 004.75
Статья посвящена новому исследовательскому проекту, направленному на обобщение динамического контента веб-страниц. Значительная часть информации в Интернете теряется из-за временной природы веб-документов. Таким образом, адаптация методов обобщения для веб-документов является актуальной задачей. Исследование нацелено на разработку методов обобщения изменяющегося контента, который извлечен из коллекции тематических веб-страниц, которые связаны между собой, за определенные промежутки времени. В данной статье рассматриваются наиболее известные тематики и концепции, обнаруженные в веб-коллекциях, которые являются ретроспективными. По причине разнообразия содержимого, а также изменений веб-контента, связанных со временем, необходимо применить методы, отличающиеся от базовых, которые применяются для документов, являющихся статическими.
1. Allan J. Temporal Summaries of News Topics / J. Allan, R. Gupta, V. Khandelwal // SIGIR '01: Proceedings of the 24th annual international ACM SIGIR conference on Research and development in information retrieval. – New York, 2001. – P. 10-18.
2. Ларичев О.И. Системы поддержки принятия решений: современное состояние и перспективы развития / О.И. Ларичев, А.Б. Петровский // Итоги науки и техники. Теория вероятностей. Математическая статистика. Теоретическая кибернетика. – 1987. – Т. 21. – С. 131-164.
3. Большаков А.А. Разработка стенда для оценки применимости транспортных протоколов в задачах обработки потоковой информации для создания адаптивной системы преобразования данных / А.А. Большаков, И.В. Егоров, В.В. Лобанов, Д.В. Лачугин // Вестник Тамбовского государственного технического университета. – 2014. – Т. 20. – № 3. – С. 440-451.
4. Jatowt A. Web Page Summarization Using Dynamic Content / A. Jatowt, M. Ishizuka // WWW Alt. '04: Proceedings of the 13th international World Wide Web conference on Alternate track papers & posters. – New York, 2004. – P. 344-345.
5. Mani I. Advances in Automatic Text Summarization / I. Mani, M.T. Maybury. – Cambridge: MIT Press, 1999. – 434 p.
6. McKeown K.R. Tracking and Summarizing News on a Daily Basis with Columbia’s Newsblaster / K.R. McKeown, R. Barzilay, D. Evans, V. Hatzivassiloglou, J.L. Klavans, A. Nenkova, C. Sable, B. Schiffman, S. Sigelman // HLT '02: Proceedings of the Second International Conference on Human Language Technology Research. – San Francisco, 2002. – P. 280-285.
7. Radev D.R. NewsInEssence: A System for Domain-Independent, Real-Time News Clustering and Multi-Document Summarization / D.R. Radev, S. Blair-Goldensohn, Z. Zhang, R.S. Raghavan // HLT '01: Proceedings of the First International Conference on Human Language Technology Research. – Stroudsburg, 2001. – P. 1-4.
8. Salton G. Term-Weighting Approaches in Automatic Text Retrieval / G. Salton, C. Buckley // Information Processing & Management. – 1988. – Vol. 24. – No. 5. – P. 513-523.
9. Зайцев Д.Л. Формальное представление деятельности пользователей с выявлением информационно-значимых объектов / Д.Л. Зайцев, А.Н. Зеленина // Вестник Воронежского института высоких технологий. – 2021. – Т. 15. – № 2 (37). – С. 45-56.
10. Зайцев Д.Л. Классификация интерактивных взаимодействий пользователя с программным обеспечением / Д.Л. Зайцев, А.Н. Зеленина // Вестник Воронежского института высоких технологий. – 2022. – Т. 16. – № 3 (42). – С. 43-48.
Ключевые слова: динамический контент, веб-коллекции, веб-страницы,
Для цитирования: Зайцев Д.Л. , Зеленина А.Н. , Степченков А.Д. , Обобщение динамического контента в веб-коллекциях. Вестник Воронежского института высоких технологий. 2024;18(2). Доступно по: https://vestnikvivt.ru/ru/journal/pdf?id=1321
Поступила в редакцию 04.06.2024
Поступила после рецензирования 07.06.2024
Опубликована 30.06.2024