Pull to refresh

«Младший брат» IBM Watson занялся анализом патентов

Reading time 3 min
Views 1.9K
На Хабре уже неоднократно обсуждался самообучаемый компьютер-эрудит IBM Watson, который способен отвечать на вопросы, разбираясь в массиве неструктурированных данных. Он проявил себя с лучшей стороны, выиграв несколько раундов викторины Jeopardy («Своя игра») у чемпионов этой игры.

Затем Watson пошёл в медицину: начал анализировать издания из национальной медицинской базы PubMed и десятки учебников. К маю 2011 года он освоил программу колледжа и первого курса университета, то есть смог правильно отвечать на вопросы экзаменов, которые сдают студенты-медики. По прогнозу разработчиков, через три-пять лет Watson будет готов для первых пилотных тестов по лечению реальных пациентов, а через 8–10 лет такие компьютеры могут найти широкое применение в больницах в качестве диагностического инструмента. Первый контракт на коммерческое использование Watson уже заключён с медицинской компанией WellPoint.

Врач-диагност — не единственная профессия, где людям трудно тягаться с автоматизированными системами анализа массива неструктурированных данных. Есть ещё одна профессия, пусть и не такая почётная. Это юрист, специалист по патентному праву.

Компания IBM разработала систему Strategic IP Insight Platform (SIIP), которую предлагают купить крупным корпорациям для анализа и управления портфелем интеллектуальной собственности. Система осуществляет дата-майнинг во всей базе патентов, анализирует архив научных журналов и другую информацию по теме, чтобы владелец интеллектуальной собственности мог проанализировать и обнаружить «проблемы» в своей или чужой патентной базе.



SIIP применили для создания базы, содержащей записи о медицинских патентах, а также биомедицинские журналы и информацию о фармацевтических препаратах. Предполагается, что эта база поможет в разработке новых лекарств.

Из каждой статьи/патента/описания система SIIP извлекла названия химических препаратов, диаграммы, имена учёных-изобретателей и другие ключевые слова. К данному моменту обработано 2,5 млн названий препаратов, 4,7 млн патентов и 11 млн журнальных статей с 1976 по 2000 годы. Часть собранной информации IBM пожертвовала в открытый справочник препаратов PubChem.

По мнению некоторых экспертов, интеллектуальную платформу SIIP можно успешно применять для борьбы с патентными троллями. К сожалению, такой вариант выглядит практически нереальным, учитывая, что компания IBM сама получает больше всех в мире патентов и является одним из самых богатых владельцев интеллектуальной собственности, используя свой багаж из 10000+ патентов для абсурдных исков. Хуже того, IBM активно выступает в поддержку софтверных патентов, а ведь для IT-компаний софтверные патенты даже опаснее, чем тролли.

Так что вряд ли искусственный интеллект, созданный IBM, будет бороться с патентными троллями. Скорее наоборот — его могут использовать для генерации ещё большего количества патентов. Или для создания самого мощного патентного тролля с применением ИИ, способного генерировать бесконечное количество «изобретений». Будем надеяться, что такие прогнозы никогда не воплотятся в жизнь.

Платформа SIIP создана на базе тех же технологий, что и IBM Watson. Напомним, что Watson представляет собой сервер IBM POWER7, для обработки информации используются Apache Hadoop и Apache UIMA, а также ряд других програмим, созданных за четыре года коллективом разработчиков IBM.





Машина названа в честь основателя компании IBM Томаса Ватсона. В будущем она станет частью системы искусственного интеллекта, способной понимать человеческий язык и отвечать на любые вопросы, черпая информацию из интернета. Способность отфильтровывать и анализировать факты может быть использована в медицине (для постановки сложных диагнозов эмпирическим путём после анализа симптомов), автоматических службах поддержки (для ответа на вопросы), туристических путеводителях и… для генерации патентов, может быть.
Tags:
Hubs:
+24
Comments 16
Comments Comments 16

Articles