В Гарварде оцифровали 6,4 миллиона судебных дел для обучения ИИ

Библиотека Школы права Гарвардского университета завершила проект Caselaw Access Project — сбор открытых данных о судебных делах, проходивших на территории США.

Об этом сообщает MIT Technology Review.

Процесс заключался в сканировании более 40 миллионов страниц документов начиная с XVII века: всего в базу данных попали примерно 6,4 миллиона судебных дел. Эти данные помогут эффективнее обучать компьютерные алгоритмы, которые могут быть использованы в юриспруденции.

Современный анализ данных позволяет применять методы машинного обучения практически к любым сферам. Разумеется, для эффективного его использования нужно очень большое количество данных. К примеру, для того, чтобы научить нейросеть распознавать пневмонию, понадобилось более миллиона рентгеновских снимков грудной клетки.

Что касается задач, включающих обработку естественного языка, то здесь данных для эффективной работы должно быть использовано еще больше. В особенности, когда дело касается принятия важных решений. Разработка алгоритмов, которые могли бы принимать решения и облегчать процесс в суде, — одна из таких задач.

Облегчить ее выполнение решили исследователи из Школы права Гарвардского университета, которые в течение нескольких лет сканировали и анализировали открытые материалы, принадлежащие библиотеке университета. Материалы включали в себя судебные заключения и стенографии: в них содержатся полные доступные материалы по каждому судебному делу. Первые документы датируются 1658 годом, а последние — 2018. Всего для создания базы данных исследователи оцифровали около 40 миллионов страниц, а общее количество дел превышает 6,4 миллиона.

Пригодиться база данных может не только разработчикам, но и юристам. Для получения доступа к ней необходимо зарегистрироваться на сайте проекта. Кроме того, пока что действует ограничение на скачивание: разработчики позволяют получать только 500 документов в день. Это ограничение введено партнерами проекта — технологическим стартапом Ravel Law — и будет действовать примерно до марта 2024 года, после чего доступ ко всем документам должен стать свободным. Базовые данные (названия дел, дата и суд) доступны полностью уже сейчас.

Стоит отметить, что искусственный интеллект уже применяется в юриспруденции. К примеру, в прошлом году ученым удалось научить распознавать обман подсудимых по голосу и выражению лица эффективнее, чем это делают люди.

Источник: N+1




!

Если для Вас конкретно эта новость оказалась важной или интересной - пожалуйста, поделитесь ею в своей любимой социальной сети с помощью кнопок, расположенных под этим текстом. Это поможет нам в будущем делать более качественную подборку материалов, исходя из Ваших потребностей\интересов.




Коды для вставки в блог\форум

blog comments powered by Disqus


Вспомним другие новости из этого раздела?


Наука и техника

←+Ctrl+→

Интересные новости
Искусственная свинина подешевела за месяц в 12 разИскусственная свинина подешевела за месяц в 12 раз
Генетики раскрыли причины зарождения многих видов ракаГенетики раскрыли причины зарождения многих видов рака
В Китае теперь могут идентифицировать человека по походке
Учёные создали нанороботов, способных «просверлить» ткань глаза, не повредив еёУчёные создали нанороботов, способных «просверлить» ткань глаза, не повредив её
Создан 3D-принтер для печати бумажными отходамиСоздан 3D-принтер для печати бумажными отходами
Блок рекламы


Похожие новости

Жадность, хрупкость, непрозрачность и мелочность: что не так с ИИ на основе глубинного обученияЖадность, хрупкость, непрозрачность и мелочность: что не так с ИИ на основе глубинного обучения
NASA перенесет на Марс более 2,4 миллиона именNASA перенесет на Марс более 2,4 миллиона имен
Докторскую работу Стивена Хокинга просмотрели два миллиона разДокторскую работу Стивена Хокинга просмотрели два миллиона раз
По меньшей мере 1,4 миллиона человек в Европе ежегодно умирают из-за загрязнения окружающей средыПо меньшей мере 1,4 миллиона человек в Европе ежегодно умирают из-за загрязнения окружающей среды
Ученые насчитали в Антарктиде на 3,6 миллиона больше пингвинов, чем считалось ранееУченые насчитали в Антарктиде на 3,6 миллиона больше пингвинов, чем считалось ранее
В Аргентине нашли «прародителя» картофеля возрастом 52 миллиона летВ Аргентине нашли «прародителя» картофеля возрастом 52 миллиона лет
В Гарварде создали микрорадиоприемник из дефектного алмаза (ВИДЕО)В Гарварде создали микрорадиоприемник из дефектного алмаза (ВИДЕО)
Дрон с помощью машинного обучения начал ориентироваться в невесомостиДрон с помощью машинного обучения начал ориентироваться в невесомости
Астрономы создали крупнейшую 3D-карту Вселенной с миллионами галактикАстрономы создали крупнейшую 3D-карту Вселенной с миллионами галактик
АЭС Украины выработали 262 миллиона киловатт/часов электроэнергииАЭС Украины выработали 262 миллиона киловатт/часов электроэнергии
Последние новости

Подгружаем последние новости