Keywords: full-text search, parallel computing, multithreading, IS design
DEVELOPMENT OF INFORMATION SYSTEM FOR QUICK FULL TEXT SEARCH IN FILES
UDC 004
The relevance of the research topic is due to several factors: the rapid development of electronic document management systems (EDM), and, as a result, the need to search for information by keywords in a large number of documents that often arises at enterprises; the possibility of presence in third-party search engines of undeclared features (including backdoors) or malware (viruses, Trojans, etc.), which reduces the security of using these systems to search for information in documents containing commercial or other secret or other confidential information). The obtained result of the research is an easy-to-use, fully functional information retrieval software system that performs full-text search in files faster than common analogues. The main advantages of the developed software system are ease of use, intuitive interface, high speed. Planned scope of the research results: Any organization or private enterprise, personal use.
1. Демихов М. А. Поисковые методы на основе tree-деревьев / М. А. Демихов // Вестник Воронежского института высоких технологий. – 2016. – №. 4. – С. 99-102.
2. Львович И. Я., Кравцова Н. Е., Чупринская Ю. Л. Особенности решений для обработки текстовых данных / И. Я. Львович, Н. Е. Кравцова, Ю. Л. Чупринская // Вестник Воронежского института высоких технологий. – 2019. – №. 1. – С. 89-92.
3. Преображенский Ю. П. Анализ ме-тодов нечеткого поиска / Ю. П. Преображенский, Д. Н. Мирошник // Вестник Воронежского института высоких технологий. – 2018. – №. 4. – С. 82-84.
4. Решетников А. Д. О подходах для определения меры несходства в текстовых данных А. Д. Решетников // Вестник Воронежского института высоких технологий. – 2019. – №. 3. – С. 35-39.
5. Шапаев А. В. Проблемы поиска текстовой информации в больших объемах дан-ных / А. В. Шапаев, Д. А. Юдаков, А. А. Часовской // Вестник Воронежского института высоких технологий. – 2019. – №. 1. – С. 113-115.
6. Ширяев В. В. Извлечение текстовых данных из документов формата PDF, DOCX (DOC) с помощью сторонних библиотек / В. В. Ширяев, А. В. Турчановская // Труды семинара по геометрии и математическому моделированию. – 2019. – №. 5. – С. 158-160.
7. Шахова О. А. Статистическая обработка результатов исследований: учебное пособие / Шахова О. А. – Тюмень: Издательство «Титул», 2022. – 103 c.
8. Мельникова Т. В. Моделирование обработки больших массивов данных в распределенных информационно-телекоммуникационных системах / Т. В. Мельникова, М. В. Питолин, Ю. П. Преображенский // Моделирование, оптимизация и информационные технологии. – 2022. – Т. 10. – № 1 (36). Доступно по: https://moitvivt.ru/journal/article?id=1117 (дата обращения: 10.09.2022).
Keywords: full-text search, parallel computing, multithreading, IS design
For citation: Avdeev A.V. , Zelenina A.N. , DEVELOPMENT OF INFORMATION SYSTEM FOR QUICK FULL TEXT SEARCH IN FILES. Bulletin of the Voronezh Institute of High Technologies. 2022;16(3). Available from: https://vestnikvivt.ru/ru/journal/pdf?id=63 (In Russ).
Published 30.09.2022