Skip to content

Domnenko-Aleksey/18_text_segmentation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

Сегментация текстов договоров

domnenko@mail.ru, telegram: @domnenko_a_n

Решение

Colab: https://colab.research.google.com/drive/1rE8fr8ie0aby6sfKi99v8hgpRHxp-_1s?usp=sharing

Сегментация текстов договоров, поиск сущностей.

Для обучения модели используется датасет, состоящий из 423 договоров, размеченным на на сегменты тегами:

Теги:

<s1> - Условия

<s2> - Запреты

<s3> - Цена

<s4> - Условия (относительно дат)

<s5> - Штрафы

<s6> - Адреса и местоположения

Выводы

Для исследования вытирали модели нейронных сете:

  • Conv1D (полносвязная, прямого распространения)

  • PSPnet

  • Unet

На малых эпохах обучения лидировала Conv1D сеть, на больших Unet

About

Сегментация текстов договоров, поиск сегметнов: условия, запреты, цена и др.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors