Разработка метода бесконтактной генерации содержимого структурированного электронного медицинского документа на основе вербального словесного описания
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
SCIENTIFIC JOURNAL BULLETIN OF VORONEZH INSTITUTE OF HIGH TECHNOLOGIES
Online media
ISSN 2949-4443

Development of a Method for Non-Contact Generation of Content of a Structured Electronic Medical Document Based on Verbal Verbal Description

Lomakin A.S. ,  idStepanov S.V. , idDonsckaia A.R.

UDC 004.89:616-006:616-07

  • Abstract
  • List of references
  • About authors

This paper presents a method for automatically populating structured electronic medical documents based on physician speech recognition. The proposed solution converts verbal descriptions dictated during a medical consultation into an XML document compliant with schematron standards approved by the Russian Ministry of Health. In the initial phase, a comparative analysis of automatic speech recognition models – including Whisper and Vosk – was conducted, evaluating accuracy, noise robustness, and support for medical terminology. Whisper was selected as the primary model and further fine-tuned on synthetic medical data. To process the transcribed text, the LLM-Gigachat large language model was used to extract key document fields. Implementation of the proposed approach led to a 39% reduction in ultrasound examination time due to automated documentation, thereby improving workflow efficiency and patient service quality.

1. Barr A. The Handbook of Artificial Intelligence: Volume 1 / A. Barr, E.A. Feigenbaum. – Los Altos: William Kaufmann, Inc., 1981. – 442 p.

2. Видение современной концепции систем поддержки принятия врачебных решений в системе здравоохранения России / А.С. Ломакин, А.В. Зубков, А.Р. Виноградов, Н.Д. Сибирный // Инженерный вестник Дона. – 2024. – № 7. – URL: http://www.ivdon.ru/ru/magazine/archive/n7y2024/9337 (дата обращения: 26.04.2025).

3. The Integration of Artificial Intelligence in Robotic Surgery: A Narrative Review / Ch. Zhang, M.S. Hallbeck, H. Salehinejad, C. Thiels // Surgery. – 2024. – Vol. 176, Iss. 3. – P. 552–557.

4. Огнева Е.Ю. Формирование нового менеджмента в работе детской поликлиники на основе анализа проблем здоровья детей и независимой оценки качества оказания услуг / Е.Ю. Огнева, А.Н. Гуров, И.В. Давронов // Менеджер здравоохранения. – 2018. – № 7. – С. 36–44.

5. Характеристика врачебных кадров разного профиля в субъектах Российской Федерации / С.А. Леонов, Э.Н. Матвеев, В.Г. Акишкин [и др.] // Социальные аспекты здоровья населения. – 2010. – № 1 (13). – URL: http://vestnik.mednet.ru/content/view/166/30/ (дата обращения: 26.04.2025).

6. Is Noise Reduction Improving Open-Source ASR Transcription Engines Quality? / A. Trabelsi, L. Werey, S. Warichet, E. Helbert // Proceedings of the 16th International Conference on Agents and Artificial Intelligence – Volume 3: ICAART. – 2024. – P. 1221–1228.

7. Banerjee S., Agarwal A., Ghosh P. High-Precision Medical Speech Recognition Through Synthetic Data and Semantic Correction: UNITED-MEDASR // arXiv [Электронный ресурс]. – URL: https://arxiv.org/abs/2412.00055 (дата обращения: 26.04.2025).

8. Пилотное внедрение технологий распознавания речи в эндоскопических центрах ДЗМ / А.В. Шабунин, В.В. Бедин, И.Ю. Коржева [и др.] // Здоровье мегаполиса. – 2023. – Т. 4, № 1. – С. 68–74.

9. Сравнение Vosk и Whisper // Хабр [Электронный ресурс]. – URL: https://habr.com/ru/articles/814057/ (дата обращения: 26.04.2025).

10. Биктимиров А.Р. Способы повышения эффективности работы программы транскрибаций речи / А.Р. Биктимиров, Д.Ю. Груздев // Научный результат. Вопросы теоретической и прикладной лингвистики. – 2022. – Т. 8, № 4. – С. 72–89.

11. Портал оперативного взаимодействия участников единой государственной информационной системы в сфере здравоохранения [Электронный ресурс]. – URL: https://portal.egisz.rosminzdrav.ru/materials (дата обращения: 26.04.2025).

12. Zhao W.X., Zhou K., Li J. [et al.]. A Survey of Large Language Models // arXiv [Электронный ресурс]. – URL: https://arxiv.org/abs/2303.18223 (дата обращения: 26.04.2025).

Lomakin Arseniy Sergeevich

Volgograd State Technical University

Volgograd, Russia

Stepanov Stanislav Vladislavovich

ORCID |

Volgograd State Technical University

Volgograd, Russia

Donsckaia Anastasia Romanovna

Scopus | ORCID |

Volgograd State Technical University
Volgograd State Medical University

Volgograd, Russia

Keywords: artificial intelligence, speech recognition, LLM, machine learning, healthcare, medical technologies, digitalization

For citation: Lomakin A.S. , Stepanov S.V. , Donsckaia A.R. , Development of a Method for Non-Contact Generation of Content of a Structured Electronic Medical Document Based on Verbal Verbal Description. Bulletin of the Voronezh Institute of High Technologies. 2025;19(2). Available from: https://vestnikvivt.ru/ru/journal/pdf?id=1420 (In Russ).

15

Full text in PDF

Received 26.04.2025

Revised 14.05.2025