QuickInsight

В современном мире рабочим в научной сфере приходится тщательно изучать и анализировать огромное кол-во письменных научных работ, что отнимает очень много сил и времени.

В таких условиях AI-ассистент способный сжать, обработать и поставить главные тезисы текста— просто необходим.

Цель проекта

Разработать научного ассистента, который поможет научным сотрудникам более эффективно управлять информацией и сократить время на обработку и анализ научных публикаций

Актуальность

Актуальность создания AI-ассистента для работы с научной литературой обусловлена увеличением объема публикаций и научных исследований, происходящим на фоне быстрого развития науки и технологий.

Современные исследователи сталкиваются с необходимостью анализа огромного количества данных, что требует значительных временных затрат и концентрации внимания.

Анализ области

Процесс работы с научной литературой

Поиск релевантных источников: учёные используют базы данных для поиска статей по ключевым словам или темам.
Отбор статей для изучения: учёные отбирают статьи на основе их заголовков, аннотаций и ключевых слов, чтобы определить самое важное для их исследования.
Чтение и анализ: дальше специалисты читают полный текст, анализируют методику, результаты и выводы.
Структурирование информации: распределение статьи для более быстрого обращения к ней в будущем.
Цитирование и оформление ссылок: учёные используют библиографические менеджеры для автоматизации создания ссылок и цитат в их публикациях.

Проблемы при работе с научной литературой

Объем информации : учёные сталкиваются с проблемой “информационной перегрузки”
Неполные данные или плохая структура: иногда статьи могут быть плохо структурированы.
Неэффективные методы поиска: трудоёмкость в поиске нужных статей
Время на анализ: исследователи тратят огромное количество времени на чтение и анализ полного текста статей, даже если некоторые из них могут не быть напрямую полезными.
Дублирование исследований: существует риск дублирования исследований или недостатка знаний о существующих решениях.

Исследовательский анализ

Большинство научных статей написаны на английском языке, он стал основным языком для научных исследований.

Основные тематики научных статей:

Технические и инженерные науки
Медицина и биология
Химия и физика
Компьютерные науки и IT
Социальные и гуманитарные науки

Проблемы связанные с научными данными:

Языковой барьер
Доступность научных статей
Релевантность и качество данных
Проблемы с воспроизводимостью
Объем и фильтрация

Эти проблемы и стимулируют создание научных ассистентов для суммаризации данных.

Анализ конкурентов

Scholarcy	LexRank	SummarizeBot
это веб-приложение, которое автоматически создает краткие резюме научных статей и отчетов.	это алгоритм (написанный библиотеки для Pythone “sumy”) на основе графов для автоматической суммаризации текстов, который активно используется.	универсальный инструмент, который поддерживает не только суммаризацию научных текстов, но и новостных статей, технической документации и других типов данных.

Все предоставленные решения ( за исключением LexRank ), являются проектами, работающими на облачном хранилище.

Все решения ограничиваются лишь на сжатие текста и постановки его главных задач и смыслов.

Наше же решение способно отвечать на поставленные пользователем вопросам по данному тексту, что позволяет использовать наш ассистент в помощи при подготовки условного теоретического материала для лекций.

API vs использование локально

	Локальное использование	Использование API
+	- Конфиденциальность и безопасность данных - Независимость - Настройка под конкретные задачи (дообучение)	- Быстрая интеграция и простота развертывания - Масштабируемость - Постоянные обновления
-	- Стоимость оборудования для локального запуска - Необходимость обслуживания и управления - Ограниченная масштабируемость	- Риски для конфиденциальности данных -Ограниченные возможности для настройки - Задержки и зависимость от сети

Ключевые особенности

Наше решение может помочь научным специалистам не только по отдельным определённым факторам их трудоёмкой работы, а помогаем во всех поставленных нами проблемами в их сфере.

Поиск — наш ассистент упрощает процесс поиска определённых статей по ключевым словам и главной теме
Обработка — ассистент способен сжимать и суммаризировать текст. Ассистент обрабатывает исходный текст, определяет его формат (PDF, TXT, и др.), при языковой модели сжимает его и выводит тезисы с вопросами по получившемуся тексту.
Ответы на вопросы — ассистент способен ответить на любой вопрос по тексту.

План реализации

Технологическая основа

Инструменты и билиотеки

Python был выбран в качестве основного языка программирования, поскольку он является предпочтительным при работе с нейронными сетями благодаря своей простоте использования и многофункциональности.

Так же при реализации интефейса использовался язык гипертекстовой разметки HTML , так же использовался JavaScript , CSS

Библиотеки

Langchain API - библиотека, предоставляющая удобный инструменты для локального запуска больших моделей и обработке больших объëмов данных.
Transformers - Библиотека от компании Hugging Face, которая предоставляет удобные инструменты для загрузки и использования разнообразного количества моделей.
Flask - это простой в использовании фреймворк для создания веб-приложений на языке программирования Python.
arxiv - это простая в использовании библиотека для поиска и получения данных из электронного архива arXiv.org.

Также в качестве инструмента для поиска статей по более разнообразным темам можно использовать openalex , библиотека arxiv работает заметно быстрее, но имеет ограничения по доступным темам

Модель

В качестве основной тестовой модели использовалась Pixtral 12B .

Pixtral - это языковая модель от компании Mistral с поддержкой изображений.

Основные характеристики

Общее количество параметров: 12 миллиардов.
Архитектура:
- Vision Encoder: 400 миллионов параметров.
- Multimodal Transformer Decoder: комбинирует текст и изображения.

Контекст и токены

Максимальная длина контекста: 128,000 токенов.

Поддержка языков

Pixtral 12B поддерживает более 20 языков.

Производительность

Высокие результаты в задачах мультимодального знания (MathVista, ChartQA).
Меньшая эффективность в текстовых задачах по сравнению с моделями, такими как Claude 3 и Gemini Flash-8B.

Минимальные требования к видеопамяти

Минимально требуется: 48 ГБ видеопамяти (VRAM) для локального запуска. Модель на Hugging Face

Сравнение моделей

Главными метриками для анализа работы модели по суммаризации являются:

Text MT-Bench — метрика, оценивающая способность модели следовать инструкциям в текстовых задачах.
Text IF-Eval — метрика также оценивает способность модели следовать инструкциям, но в более широком контексте . Эта метрика подходит для проверки того, насколько модель справляется с такой задачей.
MMLU (5-shot) — измеряет общие способности модели в текстовых задачах. MMLU включает задания на понимание и обработку информации из текстов, что может частично отражать способность модели к созданию осмысленных суммаризаций.

На основе этих данных можно сделать вывод, что модель Pixtral лучше своих аналогов, а также не уступает и моделям намного больше неё.

Мы также сравнили модели для резюмирования:

Pixtral	Gpt-4o	Gemini-1.5-Flash	Qwen2-72B-Instruct

Интерфейс проекта

Сайт состоит из трех страниц.

1 страница	2 страница

3 страница

Использование

2024-11-03.182440.mp4

Доступ

На данный момент сайт работает. Его можно опробовать по ссылкам:

Установка и запуск

Чтобы запустить локальную копию, выполните следующие простые шаги.

Учтите Python должен быть не менее 3.10.5

# Клонируем репозиторий

> git clone https://github.com/pocketgodru/sirius_ai_biocad.git

  

# Перемещаемся в него

> cd sirius_ai_biocad
  


#Устанавливаем список библиотек

> pip install -r requirements.txt


> python app.py

Перспективы

1. Увеличение скорости работы и улучшение качества ответов.

2. Добавление новых функций по типу отдельных чатов для каждого документа .

3. Создание полноценного сервиса, с регистрацией пользователя и возможности выбора модели для обработки.

4. Внедрение ещё больших функций , по типу создания лекций

Обратная связь

kv.chekurin@gmail.com

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
static		static
templates		templates
uploads		uploads
utils		utils
Readme.md		Readme.md
app.ipynb		app.ipynb
app.py		app.py
favicon.ico		favicon.ico
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

QuickInsight

Ассистент для работы с научной литературой

Структура файлов

О проекте

Цель проекта

Актуальность

Анализ области

Процесс работы с научной литературой

Проблемы при работе с научной литературой

Исследовательский анализ

Анализ конкурентов

API vs использование локально

Ключевые особенности

План реализации

Технологическая основа

Инструменты и билиотеки

Библиотеки

Модель

Основные характеристики

Контекст и токены

Поддержка языков

Производительность

Минимальные требования к видеопамяти

Сравнение моделей

На основе этих данных можно сделать вывод, что модель Pixtral лучше своих аналогов, а также не уступает и моделям намного больше неё.

Интерфейс проекта

Использование

Доступ

Установка и запуск

Перспективы

Обратная связь

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages