Использование возможностей искусственного интеллекта в иммунологии: от обзора литературы до статистической обработки и анализа полученных данных

Обложка


Цитировать

Полный текст

Аннотация

Традиционное изучение литературы, использование стандартных методов анализа данных в иммунологии занимает значительное время, не всегда позволяя справиться с масштабом и сложностью проблемы. Искусственный интеллект может помочь в решении этого вопроса, автоматизируя процессы поиска и экспертизы актуальных сведений, позволяя ученым извлекать важные факты из больших объемов информации. Целью исследования стало определение потенциала искусственного интеллекта в иммунологических исследованиях с акцентом на автоматизацию сбора литературных данных и анализ цифровых сведений. Теоретическая часть работы основана на изучении материалов баз PubMed, Scopus, Google Scholar, ResearchGate за 2000-2025 годы, тип – оригинальная статья или обзор литературы. Основа стратегии поиска – использование ключевых слов, процесс отбора публикаций заключался в скрининге заголовков, аннотаций и полных текстов исследований. Практическая часть работы выполнена как сравнительный анализ результатов, ранее изученных данных, с выводами, полученными при использовании технологий искусственного интеллекта, на примерах моделей GPT v.4.0. Установлено, что технологи искусственного интеллекта могут быть полезны в работе над созданием обзора литературы по иммунологии, включая формирование резюме, синтез графиков и схем, визуализирующих новые сигнальные пути, взаимосвязи между клетками, факторы развития заболеваний. Помимо работы с текстами, искусственный интеллект может быть применен для статистической обработки и анализа цифровых данных, например, выявления закономерностей, решения вопросов прогнозирования, построения моделей, рассмотрения других более сложных задач. При сравнении ранее изученных данных с результатами использования GPT v.4.0 установлено, что у разных чат-ботов могут встречаться следующие недостатки: зависимость ответа от стиля формулирования запроса, синтез информации в очень обобщенном виде, создание небольших объемов текста (до 1000 слов), риск плагиата, сложности с синтезом рисунков, схем, таблиц, представление исчерпывающей информации преимущественно на английском языке, самостоятельное синтезирование несуществующих ссылок на литературные источники. Выводы: 1. Искусственный интеллект может преобразовать иммунологические исследования, позволяя проводить более эффективный обзор литературы и более глубокий анализ данных, однако на начальных этапах требуется экспертный надзор. 2. По мере развития технологий искусственного интеллекта они станут неотъемлемой частью инструментария иммунолога.

Полный текст

Введение

Развитие иммунологии как науки сопровождается экспоненциальным ростом числа новых исследований, ежегодной публикацией тысяч статей. Подобная тенденция, с одной стороны, дает возможность значимо расширять горизонты знаний, с другой стороны, создает существенные проблемы для ученых, старающихся быть в курсе последних новостей и успеть проанализировать информацию из разных источников. Особенностью увеличения объема новых сведений становится ситуация, когда специалисты, занимающиеся исследованием проблем, не связанных между собой разделов иммунологии, сталкиваются с коммуникативными барьерами или пробелами в знаниях друг друга.

Традиционное изучение литературы, использование стандартных методов анализа занимает значительное время, не всегда позволяя справиться с масштабом и сложностью проблемы. Искусственный интеллект (ИИ) может помочь в решении этого вопроса, автоматизируя процессы поиска и экспертизы актуальных сведений, позволяя ученым извлекать важные факты из больших объемов данных. Например, имеется опыт применения методов искусственного интеллекта в биомедицине с использованием программ обработки естественного языка (natural language processing, NLP), машинного (machine learning, ML) и глубокого обучения (deep learning, DL) [8].

Целью данной работы стало определение потенциала искусственного интеллекта в иммунологических исследованиях с акцентом на автоматизацию сбора литературных данных и анализ цифровых сведений.

Материалы и методы

Теоретическая часть работы основана на результатах изучения материалов из открытых источников – баз PubMed, Scopus, Google Scholar, ResearchGate – за 2000-2025 годы, тип – оригинальная статья или обзор литературы; из рассмотрения исключались редакционные статьи в связи с отсутствием ссылок на научно обоснованные исследования. Основа стратегии поиска – использование ключевых слов: artificial intelligence, machine learning, NLP, data analysis, GPT (generative pre-trained transformer), immunology. Процесс отбора публикаций заключался в скрининге заголовков и аннотаций, а также полных текстов исследований, ограничением была доступность источников информации для широкого пользователя: не включены «закрытые» публикации.

Практическая часть работы выполнена как сравнительный анализ результатов ранее изученных данных [1] с выводами, полученными при использовании технологий искусственного интеллекта, на примерах моделей GPT v.4.0, в частности ChatGPT (https://chatgpt.com/), API (https://platform.openai.com/), Duck.ai (https://duckduckgo.com/?q=DuckDuckGo+AI+Chat&ia=chat&duckai=1) от OpenAI, Microsoft 365 Copilot (https://www.microsoft.com/en-us/microsoft-365/copilot), Bing Chat (https://copilot.microsoft.com/chats/7M5nYXy3DNQC7vZVBVCwE) от Microsoft, DeepSeek-R1 (https://www.deepseek.com/) от Hangzhou DeepSeek Artificial Intelligence, Qwen (https://chat.qwenlm.ai/) от Alibaba Cloud, Med-PaLM (https://sites.research.google/med-palm/) от Google Research.

Для визуализации полученных данных использован шаблон из интернет-источника https://presentation-creation.ru/.

Результаты и обсуждение

Установлено, что процесс поиска и анализа научной информации в области иммунологии может быть автоматизирован путем привлечения искусственного интеллекта. Помимо этого, возможно решение еще одной важной задачи. Известно, что литературные обзоры, выявляющие пробелы в знаниях и определяющие актуальные направления поиска, нередко содержат авторскую оценку полученных сведений [6], при этом субъективность восприятия может привести к искажению фактов, недостоверным выводам, затрудняющим сравнение полученных данных. Искусственный интеллект позволяет избежать этого недостатка: он обезличивает взгляд на проблему.

Первым направлением работы с научными текстами с привлечением искусственного интеллекта может быть собственно создание обзора литературы на какую-либо тему, например «Оценка взаимосвязи между изменением функции иммунных клеток, концентрации цитокинов с клиническими формами болезни». В основе такой работы – анализ рефератов и полнотекстовых статей из доступных источников. В частности, исследование Mohammad Piri S. и соавт. (2024) продемонстрировало возможности искусственного интеллекта в создании литературного обзора, раскрывающего патогенетическую роль Tfh в развитии аутоиммунных заболеваний.

Вторым подходом к использованию новых технологий в иммунологии может быть использование искусственного интеллекта для обобщения литературных данных, а именно: создания кратких обзоров научных статей, написания авторефератов, резюме. Для пользователя такая возможность позволяет быстро ознакомиться с основными положениями и выводами публикации. Примером может быть обобщение сведений, касающихся подходов к изучению микробиома с целью оценки его взаимодействия с макроорганизмом на основе данных экспрессии генов, изменения уровня метаболитов при разных нозологических формах [4].

Третьим подходом в использовании искусственного интеллекта для работы с текстовыми данными в области иммунологии может быть возможность синтеза графиков и схем, визуализирующих новые сигнальные пути, выявляемые взаимосвязи между разными типами клеток, факторы развития заболеваний, что позволяет синтезировать современные гипотезы в науке. Например, Kirouac D.C. и соавт. (2012) продемонстрированы возможности визуализации протеин-протеинового взаимодействия при воспалении, определены характеристики кинетического/логического моделирования воспалительной и опосредованной рецепторами передачи сигнала.

Таким образом, технологи искусственного интеллекта могут быть полезны в работе над созданием обзора литературы по иммунологии.

Помимо работы с текстами, ИИ может быть использован для статистической обработки данных, полученных в иммунологических исследованиях. В частности, такие сервисы, как Google Colab (https://colab.research.google.com/), Julius AI (https://julius.ai/), JASP (https://jasp-stats.org/) могут быть полезными для изучения результатов собственных исследований, Gnuplot (http://www.gnuplot.info/) – для графического представления данных.

Третье большое направление применения искусственного интеллекта в иммунологии – анализ полученных данных, например работа по выявлению закономерностей, вопросы прогнозирования, построения моделей, решение других более сложных задач. К основным областям работы с цифровыми данными можно отнести:

  1. Собственно анализ и систематизацию больших объемов сведений, получаемых в результате геномных, транскриптомных, протеомных исследований [10]; многие авторы отмечают, что алгоритмы ИИ, в частности модели глубокого обучения, очень эффективны при анализе результатов высокопроизводительного секвенирования.
  2. Прямую и обратную менделевскую рандомизацию, используемую для оценки взаимосвязи однонуклеотидных полиморфизмов (single nucleotide polymorphism, SNP) с фактором риска или фенотипическим признаком (нозологической формой) и для проверки обратной причинно-следственной связи в эпидемиологических исследованиях.
  3. Выявление скрытых паттернов и установление корреляционных связей между параметрами, которые могут быть неочевидны при традиционном анализе данных, как представлено в публикации Elste J. и соавт. (2024), а также моделирование межклеточных взаимодействий, например, как в исследовании Kumar A. и соавт. (2024).
  4. Идентификацию и классифицирование иммунных клеток в морфологических и гистологических препаратах с экспертной точностью как осуществили Crispino A. и соавт. (2024) в изучении Т-лимфоцитов при плоскоклеточной карциноме полости рта.
  5. Прогнозирование иммунного ответа на терапию, вакцинацию, хирургическое лечение [15], поиск биомаркеров, например, старения на основе исследования транскриптомов отдельных клеток [13].
  6. Персонализацию рекомендаций по диагностике и лечению с учетом имеющихся иммунологических данных [14] в том числе и на популяционном уровне, как, например, при пандемии COVID-19, когда исследования с привлечением возможностей искусственного интеллекта сыграли решающую роль в анализе иммунных реакций на SARS-CoV-2, что позволило получить ценную информацию для разработки вакцин [2].

Среди возможных сервисов по анализу цифровых данных с привлечением возможностей искусственного интеллекта: Bioconductor (https://www.bioconductor.org/) – для биоинформационных исследований, TensorFlow (https://www.tensorflow.org/) – для изучения генома, протеома, картирования генов, моделирования распространения инфекции, IBM Watson Studio (https://www.ibm.com/products/watson-studio) – для прогнозирования и управления рисками в иммунологии, Bioinformatics.org (https://www.bioinformatics.org/) – для анализа, моделирования и визуализации иммунологических данных.

Отдельно можно отметить возможности искусственного интеллекта в освоении иммунологии, как науки. С одной стороны, появилась перспектива быстрого доступа к необходимым данным из разных разделов дисциплины, с другой – способность синтеза ИИ тестов со множественными ответами для проверки полученных знаний [12].

Следующим этапом работы стало изучение потенциала искусственного интеллекта в решении научной задачи. На примере использования моделей GPT v.4.0 выполнен сравнительный анализ синтезированных ИИ с ранее проанализированными и опубликованными данными [1].

Установлено, что модели GPT удобны для получения ответов на конкретные запросы в условиях персонализированной обратной связи. Изучение функциональных возможностей показало наличие положительных и отрицательных сторон взаимодействия (рис. 1, табл. 1).

 

Рисунок 1. Положительные аспекты применения чат-ботов на базе GPT для научных исследований в области иммунологии на примере ранее проанализированных и опубликованных данных

Figure 1. Positive aspects of using GPT-powered chatbots for scientific research in immunology, exemplified by previously analyzed and published data

 

Таблица 1. Отрицательные особенности результатов использования чатов на базе generative pre-trained transformer в иммунологических исследованиях на примере ранее проанализированных и опубликованных данных

Table 1. Negative features of the results of using GPT-based chats in immunological research using the example of previously analyzed and published data

Выявленные особенности

Identified features

Пояснение

Explanation

Значительная зависимость ответа от стиля формулирования запроса

A significant dependence of the response on the way the query is phrased

В той или иной степени варьирует в разных чат-ботах, обусловлена наличием и использованием связи с обучающим набором данных

To one degree or another, it varies in different chatbots due to the presence and use of communication with the training dataset

Синтез информации в очень общем виде, возможны повторы для усиления впечатления о раскрытии темы запроса

Synthesis of information in a very general way, repetitions are possible to enhance the impression of the disclosure of the subject of the request

Например, ChatGPT в тексте ответа (введение, основная часть и заключение) предлагает три однообразные по смыслу формулировки; среди синтезированных ключевых слов было предложено только одно, состоящее из 1 слова, остальные – словосочетания из 2-3 слов

For example, ChatGPT offers three identical formulations in the response text (introduction, main part, and conclusion); among the synthesized keywords, only one consisted of 1 word, while the rest were phrases of 2-3 words

Синтез небольших объемов текста несмотря на запрос полноценной по объему статьи

Creating a small text despite the request of a full-length article

При запросе статьи размером в 3000 слов синтезируется текст объемом около 1000 слов; например, Microsoft 365 Copilot может предложить создание только структуры публикации

When requesting an article with a length of 3,000 words, a text with approximately 1,000 words will be generated; for instance, Microsoft 365 Copilot might suggest creating only the structure of the publication

Имеющийся риск плагиата, нет возможности проверить на наличие заимствований онлайн

There is a high risk of plagiarism, and there is no way to check for borrowings online

Причина – использование для обучения уже опубликованной информации; например, ChatGPT предлагает перейти на специализированные сервисы для определения наличия заимствований

The reason for potential plagiarism is the use of already published information for training; for example, ChatGPT suggests using specialized services to detect instances of plagiarism

Не все чат-боты позволяют синтезировать рисунки, схемы и таблицы

Not all chatbots allow the synthesis of drawings, diagrams, and tables

Например, при запросе DeepSeek-R1 иллюстрации к тексту статьи получен ответ: «не могу напрямую создавать или отображать визуальные рисунки или диаграммы, но могу описать их содержание»

For example, when requesting DeepSeek-R1 to provide illustrations for the article, the response was: “I cannot directly create or display visual images or diagrams, but I can describe their content”

Большая часть чат-ботов имеет лучшие возможности при работе на языке оригинала (чаще – на английском языке)

Most chatbots have better capabilities when working in the original language (most often in English)

Небольшая часть чат-ботов способна к работе на русском языке, но информационные возможности ниже, чем у англоязычных моделей

A small number of chatbots are capable of working in Russian, but their informational capabilities are lower compared to English-language models

Возможно самостоятельное синтезирование несуществующих ссылок для обзора литературы

Artificial intelligence can independently generate non-existent references for a literature review

Например, предложенная DeepSeek-R1ссылка:

Wang L.L. et al. (2021) “Extracting immune-related gene-disease associations from PubMed using natural language processing.” *Bioinformatics*, 37(15), 2121–2129. https://doi.org/10.1093/bioinformatics/btab123

не существует, наиболее близкой по смыслу оказалась работа: Bravo À., Piñero J., Queralt-Rosinach N., Rautschka M., Furlong L.I. Extraction of relations between genes and diseases from text and large-scale data analysis: implications for translational research. BMC, 2015, Bioinformatics, Vol. 16, no. 55. https://doi.org/10.1186/s12859-015-0472-9

For example, the reference suggested by DeepSeek-R1: Wang L.L., et al. (2021). “Extracting immune-related gene-disease associations from PubMed using natural language processing.” *Bioinformatics*, 37(15), 2121–2129. https://doi.org/10.1093/bioinformatics/btab123

does not exist, and the closest match in meaning is the paper: Bravo À., Piñero J., Queralt-Rosinach N., Rautschka M., Furlong L.I. Extraction of relations between genes and diseases from text and large-scale data analysis: implications for translational research. BMC, 2015, Bioinformatics, Vol. 16, no. 55 https://doi.org/10.1186/s12859-015-0472-9

Представление ссылок после статьи без упоминания в тексте

The references used in the article are located at the end, and there are no citations in the text

Предложенные Qwen chat ссылки приводились только в конце текста статьи

The references suggested by Qwen chat were placed only at the end of the article

Не определены условия публикации научных материалов, полученных путем использования ИИ

The conditions for publishing scientific materials obtained through the use of AI have not been defined

При публикации статей в журналах требуется указывать использование ИИ при подготовке работы

When publishing articles in journals, it is required to specify the use of AI in the preparation of the work

 

В целом использование ИИ в научных исследованиях является многообещающим, однако, для получения точных иммунологических сведений и создания оригинального контента требуется профессиональный надзор. Как следствие, несмотря на имеющийся потенциал, применение искусственного интеллекта в иммунологии в настоящее время сталкивается с некоторыми трудностями: имеется сложность в понимании того, на основании чего ИИ делает выводы. Необъективность набора данных, неполные аннотации и вариативность экспериментальных протоколов, могут ограничить точность и обобщаемость прогнозов/прогностических моделей, что пока создает сложности внедрения синтезированных ИИ сведений в науку и практику. Вместе с тем, интеграция ИИ в иммунологические исследования, например, появляющиеся специализированные чат-боты, работающие с медико-биологическими данными, или такие флагманские модели, такие как Grok-3 и в целом модели следующего поколения (v.5.0), открывают огромные перспективы для улучшения нашего понимания иммунной системы и разработки новых терапевтических стратегий.

Выводы

  1. Искусственный интеллект может преобразовать иммунологические исследования, позволяя проводить более эффективный обзор литературы и более глубокий анализ данных, однако на начальных этапах требуется экспертный надзор.
  2. Несмотря на сохраняющиеся проблемы, постоянное развитие и ответственное использование инструментов, ИИ может ускорить открытия и улучшить результаты лечения пациентов.
  3. По мере развития технологий искусственного интеллекта они станут неотъемлемой частью инструментария иммунолога.

Авторский комментарий

В ходе подготовки этой статьи для генерации ответов на некоторые вопросы, подбора синонимичных замен и сравнительного исследования с ранее полученными данными [1] был использован GPT v.4.0, вместе с тем весь созданный ИИ контент полностью редактировался в соответствии со стилистикой автора.

Автор несет полную ответственность за содержание публикации.

×

Об авторах

Ольга Викторовна Бердюгина

ФГБУН «Институт иммунологии и физиологии» Уральского отделения Российской академии наук

Автор, ответственный за переписку.
Email: berolga73@rambler.ru
ORCID iD: 0000-0003-3479-9730
SPIN-код: 5230-7435

д.б.н., ведущий научный сотрудник лаборатории иммунологии воспаления

Россия, г. Екатеринбург

Список литературы

  1. Бердюгина O.В., Гусев Е.Ю. Холекальциферол в роли средства неспецифической иммунопрофилактики COVID-19 // Медицинская иммунология, 2023, Т. 25, № 4. С. 823-830. [Berdiugina O.V., Gusev E.Yu Cholecalciferol as a means of nonspecific immunoprophylaxis against COVID-19. Meditsinskaya immunologiya = Medical Immunology (Russia), 2023, Vol. 25, no. 4, pp. 823-830. (In Russ.)] doi: 10.15789/1563-0625-CAA-2849.
  2. Abd-Alrazaq A., Schneider J., Mifsud B., Alam T., Househ M., Hamdi M., Shah Z. A comprehensive overview of the COVID-19 literature: machine learning-based bibliometric analysis. J. Med. Internet Res., 2021, Vol. 23, no. 3, e23703. doi: 10.2196/23703.
  3. Crispino A., Varricchio S., Ilardi G., Russo D., Di Crescenzo R.M., Staibano S., Merolla F. A Digital workflow for automated assessment of tumor-infiltrating lymphocytes in oral squamous cell carcinoma using QuPath and a StarDist-based model. Pathologica, 2024, Vol. 116, no. 6, pp. 390-403.
  4. D’Elia D., Truu J., Lahti L., Berland M., Papoutsoglou G., Ceci M., Zomer A., Lopes M.B., Ibrahimi E., Gruca A., Nechyporenko A., Frohme M., Klammsteiner T., Pau E.C.S., Marcos-Zambrano L.J., Hron K., Pio G., Simeon A., Suharoschi R., Moreno-Indias I., Temko A., Nedyalkova M., Apostol E.-S., Truică C.-O., Shigdel R., Telalović J.H., Bongcam-Rudloff E., Przymus P., Jordamović N.B., Falquet L., Tarazona S., Sampri A., Isola G., Pérez-Serrano D., Trajkovik V., Klucar L., Loncar-Turukalo T., Havulinna A.S., Jansen C., Bertelsen R.J., Claesson M.J. Advancing microbiome research with machine learning: key findings from the ML4Microbiome COST action. Front. Microbiol., 2023, Vol. 14, 1257002. doi: 10.3389/fmicb.2023.1257002.
  5. Elste J., Saini A., Mejia-Alvarez R., Mejía A., Millán-Pacheco C., Swanson-Mungerson M., Tiwari V. Significance of artificial intelligence in the study of virus-host cell interactions. Biomolecules, 2024, Vol. 14, no. 8, 911. doi: 10.3390/biom14080911.
  6. Gupta L., Gasparyan A.Y., Misra D.P., Agarwal V., Zimba O., Yessirkepov M. Information and misinformation on COVID-19: a cross-sectional survey study. J. Korean Med. Sci., 2020, Vol. 35, no. 27, e256. doi: 10.3346/jkms.2020.35.e256.
  7. Kirouac D.C., Saez-Rodriguez J., Swantek J., Burke J.M., Lauffenburger D.A., Sorger P.K. Creating and analyzing pathway and protein interaction compendia for modelling signal transduction networks. BMC Syst. Biol., 2012, Vol. 6, 29. doi: 10.1186/1752-0509-6-29.
  8. Kryś J.D., Głowacki M., Śmieja P., Gront D. deepBBQ: A deep learning approach to the protein backbone reconstruction. Biomolecules, 2024, Vol. 14, no. 11, 1448. doi: 10.3390/biom14111448.
  9. Kumar A., Dixit S., Srinivasan K., M D., Vincent P.M.D.R. Personalized cancer vaccine design using AI-powered technologies. Front. Immunol., 2024, Vol. 15, 1357217. doi: 10.3389/fimmu.2024.1357217.
  10. Liang X., Zhou R., Li Y., Yang L., Su M., Lai K.P. Clinical characterization and therapeutic targets of vitamin A in patients with hepatocholangiocarcinoma and coronavirus disease. Aging, 2021, Vol. 13, no. 12, pp. 15785-15800. doi: 10.18632/aging.203220.
  11. Mohammad Piri S., Amin Habibi M., Shool S., Khazaeli Najafabadi M., Ahmadpour S., Alemi F., Aria Nejadghaderi S., Shokri P., Abdi M., Asghari N., Amir Asef-Agah S., Tavakolpour S. Role of T follicular helper cells in autoimmune rheumatic Diseases: A systematic review on immunopathogenesis and response to treatment. Hum. Immunol., 2024, Vol. 85, no. 5, 110838. doi: 10.1016/j.humimm.2024.110838.
  12. Stadler M., Horrer A., Fischer M.R. Crafting medical MCQs with generative AI: A how-to guide on leveraging ChatGPT. GMS J. Med. Educ., 2024, Vol. 41, no. 2, 20. doi: 10.3205/zma001675.
  13. Wolf J., Rasmussen D.K., Sun Y.J., Vu J.T., Wang E., Espinosa C., Bigini F., Chang R.T., Montague A.A., Tang P.H., Mruthyunjaya P., Aghaeepour N., Dufour A., Bassuk A.G., Mahajan V.B. Liquid-biopsy proteomics combined with AI identifies cellular drivers of eye aging and disease in vivo. Cell, 2023, Vol. 186, no. 22, pp. 4868-4884.e12.
  14. Wong D.S.H., Santos A.F. The future of food allergy diagnosis. Front. Allergy, 2024, Vol. 5, 1456585. doi: 10.3389/falgy.2024.1456585.
  15. Xiang Z., Hu J., Bu S., Ding J., Chen X., Li Z. Machine learning based prediction models for the prognosis of COVID-19 patients with DKA. Sci. Rep., 2025, Vol. 15, no. 1, 2633. doi: 10.1038/s41598-025-85357-9.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рисунок 1. Положительные аспекты применения чат-ботов на базе GPT для научных исследований в области иммунологии на примере ранее проанализированных и опубликованных данных

Скачать (484KB)

© Бердюгина О.В., 2025

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № 77 - 11525 от 04.01.2002.


Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах