Разработка метода бесконтактной генерации содержимого структурированного электронного медицинского документа на основе вербального словесного описания
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
НАУЧНЫЙ ЖУРНАЛ ВЕСТНИК ВОРОНЕЖСКОГО ИНСТИТУТА ВЫСОКИХ ТЕХНОЛОГИЙ
cетевое издание
ISSN 2949-4443

Разработка метода бесконтактной генерации содержимого структурированного электронного медицинского документа на основе вербального словесного описания

Ломакин А.С. ,  idСтепанов С.В. , idДонская А.Р.

УДК 004.89:616-006:616-07

  • Аннотация
  • Список литературы
  • Об авторах

В статье рассматривается метод автоматического заполнения структурированных электронных медицинских документов на основе распознавания речи врача. Разработанное решение позволяет преобразовывать вербальные описания, продиктованные во время приёма, в XML-документ, соответствующий утверждённым схематронам Минздрава России. На первом этапе был проведён сравнительный анализ моделей автоматического распознавания речи, включая Whisper и Vosk, по критериям точности, устойчивости к шуму и поддержке медицинской терминологии. В качестве основной модели была выбрана Whisper, прошедшая дообучение на синтетических медицинских данных. Для обработки распознанного текста использовалась большая языковая модель LLM-Gigachat, выделяющая ключевые поля документа. В результате внедрения предложенного подхода было достигнуто снижение времени приёма врача УЗИ на 39% за счёт автоматизации документооборота, что повысило эффективность работы и качество обслуживания пациентов.

1. Barr A. The Handbook of Artificial Intelligence: Volume 1 / A. Barr, E.A. Feigenbaum. – Los Altos: William Kaufmann, Inc., 1981. – 442 p.

2. Видение современной концепции систем поддержки принятия врачебных решений в системе здравоохранения России / А.С. Ломакин, А.В. Зубков, А.Р. Виноградов, Н.Д. Сибирный // Инженерный вестник Дона. – 2024. – № 7. – URL: http://www.ivdon.ru/ru/magazine/archive/n7y2024/9337 (дата обращения: 26.04.2025).

3. The Integration of Artificial Intelligence in Robotic Surgery: A Narrative Review / Ch. Zhang, M.S. Hallbeck, H. Salehinejad, C. Thiels // Surgery. – 2024. – Vol. 176, Iss. 3. – P. 552–557.

4. Огнева Е.Ю. Формирование нового менеджмента в работе детской поликлиники на основе анализа проблем здоровья детей и независимой оценки качества оказания услуг / Е.Ю. Огнева, А.Н. Гуров, И.В. Давронов // Менеджер здравоохранения. – 2018. – № 7. – С. 36–44.

5. Характеристика врачебных кадров разного профиля в субъектах Российской Федерации / С.А. Леонов, Э.Н. Матвеев, В.Г. Акишкин [и др.] // Социальные аспекты здоровья населения. – 2010. – № 1 (13). – URL: http://vestnik.mednet.ru/content/view/166/30/ (дата обращения: 26.04.2025).

6. Is Noise Reduction Improving Open-Source ASR Transcription Engines Quality? / A. Trabelsi, L. Werey, S. Warichet, E. Helbert // Proceedings of the 16th International Conference on Agents and Artificial Intelligence – Volume 3: ICAART. – 2024. – P. 1221–1228.

7. Banerjee S., Agarwal A., Ghosh P. High-Precision Medical Speech Recognition Through Synthetic Data and Semantic Correction: UNITED-MEDASR // arXiv [Электронный ресурс]. – URL: https://arxiv.org/abs/2412.00055 (дата обращения: 26.04.2025).

8. Пилотное внедрение технологий распознавания речи в эндоскопических центрах ДЗМ / А.В. Шабунин, В.В. Бедин, И.Ю. Коржева [и др.] // Здоровье мегаполиса. – 2023. – Т. 4, № 1. – С. 68–74.

9. Сравнение Vosk и Whisper // Хабр [Электронный ресурс]. – URL: https://habr.com/ru/articles/814057/ (дата обращения: 26.04.2025).

10. Биктимиров А.Р. Способы повышения эффективности работы программы транскрибаций речи / А.Р. Биктимиров, Д.Ю. Груздев // Научный результат. Вопросы теоретической и прикладной лингвистики. – 2022. – Т. 8, № 4. – С. 72–89.

11. Портал оперативного взаимодействия участников единой государственной информационной системы в сфере здравоохранения [Электронный ресурс]. – URL: https://portal.egisz.rosminzdrav.ru/materials (дата обращения: 26.04.2025).

12. Zhao W.X., Zhou K., Li J. [et al.]. A Survey of Large Language Models // arXiv [Электронный ресурс]. – URL: https://arxiv.org/abs/2303.18223 (дата обращения: 26.04.2025).

Ломакин Арсений Сергеевич

Волгоградский государственный технический университет

Волгоград, Россия

Степанов Станислав Владиславович

ORCID |

Волгоградский государственный технический университет

Волгоград, Россия

Донская Анастасия Романовна

Scopus | ORCID |

Волгоградский государственный технический университет
Волгоградский государственный медицинский университет

Волгоград, Россия

Ключевые слова: искусственный интеллект, распознавание речи, LLM, машинное обучение, здравоохранение, медицинские технологии, цифровизация

Для цитирования: Ломакин А.С. , Степанов С.В. , Донская А.Р. , Разработка метода бесконтактной генерации содержимого структурированного электронного медицинского документа на основе вербального словесного описания. Вестник Воронежского института высоких технологий. 2025;19(2). Доступно по: https://vestnikvivt.ru/ru/journal/pdf?id=1420

14

Полный текст статьи в PDF

Поступила в редакцию 26.04.2025

Поступила после рецензирования 14.05.2025