17 ноября в московском офисе Яндекса прошло очередное мероприятие серии Data & Science. На конференциях специалисты делятся опытом работы с big data в науке, бизнесе и других сферах жизни. На прошедшей неделе исполнительный директор «Право.ru» Александр Cарапин рассказал о применении машинного обучения и анализа данных в юридической сфере, развитии рынка Legal Tech в России, а также о предсказании вероятности исхода и продолжительности судебного дела.

Александр Сарапин начал свое выступление с тезиса о том, что очень многие воспринимают юридическую профессию как нудную и «пропахшую нафталином». А самих юристов считают занудами. Александр попросил поднять руки тех, кто считает, что юриспруденция менее интересна, чем создание беспилотных автомобилей или высокотехнологичных роботов. Спикер признался, что «нафталин» все же присутствует в юридической деятельности, однако современные разработки позволяют взглянуть по-новому на правовую сферу.
Далее эксперт рассказал об истории зарождения отрасли юридических технологий. С 2000-ых годов в Российской Федерации начался сбор данных о влиянии социально-структурных характеристик участников судебного процесса на решение суда. Тогда существовали государственные системы, такие как ГАС «Правосудие», «Книга учета сообщений о происшествиях», ГАС «Правовая статистика». В 2010 году «Право.ru» разработали «Картотеку арбитражных дел» и систему «Мой арбитр». Фактически именно с этого момента в России началось развитие сферы Legal Tech.

Далее спикер ответил на вопрос: для чего компания собирает данные об участниках судебных процессов. Но перед этим Александр привел занимательную статистику:
- мужчины получают на 3% больший срок, чем женщины за одно и то же преступление;
- чем старше подсудимый, тем больший срок он получает;
- прописка в регионах, где идет разбирательство, уменьшает срок на 4%;
- наличие судимости в прошлом (не рецидивной) увеличивает срок на 6%;
- наличие работы уменьшает срок на 2,5%;
- наличие высшего образования увеличивает срок на 3% (!).
Спикер рассказал о том, что проблемой таких исследований всегда был адекватный учет юридически значимых характеристик преступления. И здесь, в первую очередь, речь идет об изучении уклона в правосудии. Анализ необходим для того, чтобы понять, какие факторы (как легальные, так и экстралегальные) влияют на принятие решений судами.

С появлением больших данных юридический бизнес начал трансформироваться. Сдвиг в парадигме ощутили все задействованные в правовой деятельности. Если раньше юрист был ориентирован на знания – ему нужно было быть экспертом в гражданском и уголовном кодексах, отучиться в университете, то с появлением big data стало необходимым уметь моделировать ситуацию и прогнозировать поведение судьи и оппонента. Фактически профессия трансформировалась из knowledge-based в data-driven.

Далее Александр перешел к рассказу о факторах, влияющих на исход дела. С точки зрения теории, вероятность выигрыша в нормативной модели стремится к равновесной и составляет 50 на 50%. Но здесь речь идет об идеальных условиях. На практике все выглядит несколько иначе. Судебная система поощряет истца – последний всегда является «обиженной» стороной. Также на исход дела влияет асимметрия информации. В двух словах – мы знаем нашу позицию, но можем лишь предполагать о намерениях противоположной стороны. Также из-за этого часто наши ожидания не соответствуют действительности. Еще один фактор, влияющий на исход дела – так называемый феномен repeat player. Здесь речь идет об участниках, которые системно судятся, обладают финансовыми ресурсами, ходят на заседания, как на работу. Шансов на выигрыш у них значительно больше.
Далее Александр рассказал о применяемых алгоритмах предсказания дела на примере Casebook. Для расчета берутся результаты уже завершенных дел, выделяются их признаки, например: участники, суды, судьи, вид и категория спора, список событий в деле. В основе алгоритма лежат нейронные сети. Casebook анализирует данные и выдает свой прогноз. При этом система постоянно учится — по завершении дела нейронная сеть перепроверяет полученный прогноз, чтобы учесть этот результат в будущем.