В Казанском федеральном университете 29 февраля прошла церемония торжественного вручения сертификата за исследование: «Средства извлечения и быстрого поиска информации о бизнес-событиях в больших текстовых коллекциях». Победителем конкурса стала лаборатория Высшей школы ИТИС КФУ «Интеллектуальные поисковые системы и семантические технологии». Руководитель лаборатории Валерий Соловьев отмечает, что победа КФУ сама по себе уникальна – в конкурсе участвовали множество российских вузов.
Напомним, что лаборатория «Интеллектуальные поисковые системы и семантические технологии» на базе Высшей школы ИТИС начала работать с начала декабря прошлого года. В основе ее деятельности – проведение перспективных научных исследований и прикладных разработок в области информационных технологий, активное сотрудничество с ведущими центрами в этой области – это основные приоритеты исследовательского подразделения. ИТИС, с вою очередь, – одно из молодых учебных подразделений КФУ, основанное в 2011 году. Для создания инновационного IT-факультета класса «Премиум» свои усилия объединили Министерство информатизации и связи РТ, КФУ, представители IT-компаний региона, а также известные бренды IBM, Microsoft, HP, Cisco и Oracle. Часть занятий в Высшей школе проводят приглашенные преподаватели из лучших университетов мира, а спецкурсы – опытные разработчики крупнейших IT-компаний.
В программе упомянутого конкурса было обозначено, что участники должны заявить исследовательский проект, исполнителей и срок выполнения проекта. Проект научной группы лаборатории КФУ исследователи лаборатории НР в России оценили по достоинству. Заказ на научные исследования от НР лаборатория получает впервые и работа по нему, по словам Соловьева, четко расписана на ближайшие полгода. Сегодня же, в рамках официальных переговоров, стороны обсудили перспективу сотрудничества на ближайшие три года.
В Казань на переговоры прибыли представители компании HP в Санкт-Петербурге (HPL RUSSIA – прим.авт.) Наталья Васильева и Сергей Серебряков. Для студентов питерские гости провели небольшую лекцию, в ходе которой рассказали, чем именно занимается лаборатория в северной столице России. Наталья Васильева кратко обозначила, что у HP семь региональных представительств. В список, озвученный спикером, вошли: Пало-Альто (США), Бристоль (Великобритания), Санкт-Петербург (Россия), Пекин (Китай), Бангалор (Индия), Хайфе (Израиль) и Сингапур. По словам Натальи Васильевой, в ведении лабораторий HP находится целый ряд вопросов: анализ данных, создание технологий для облачных вычислений, платформ для мобильных приложений и сервисов, сетевые технологии и решения по поддержке энергосбережения.
На питерских ученых лежит ответственность за анализ неструктурированных данных – извлечение информации из текстов и картинок/изображений. Наталья Васильева отметила, что «это сложно, востребовано и интересно». Лаборатория в Санкт-Петербурге, для примера, может исследовать мнение относительно того же мобильного телефона. В случае, когда покупатель приобрел его, но тут же решил сдать – аппарат ему чем-то не нравится, но чем именно он не знает. Предметом изучения могут стать отношения между людьми, землетрясения и даже президентские выборы (в преддверии 4 марта, куда ни кинь, всюду упоминания о предвыборных мероприятиях – прим.авт.).
Питерцы могут оказать помощь даже в извлечении ключевых понятий из большого объема документов – лежит огромная стопка, а что к чему и какова суть, разобрать сложно. При исследовании картинок ученые чаще всего берут за основу графики – в них изначально должна быть заложена какая-то текстовая информация и, к примеру, обложки книг. Изыскания российской лаборатории используются в бизнес-аналитике, рекомендательной аналитике, аннотировании генома (какой ген за что отвечает – прим.авт.) и анализе транспортных сетей (эта извечная проблема с пробками – прим.авт.). Могут эти исследования принести ощутимую пользу и на фондовом рынке – в качестве рекомендаций по продаже и покупке акций.
Сергей Серебряков более детализировано остановился на том, с чем придется столкнуться коллегам в Казани – извлечением дополнительной информации о событиях из больших текстов. В рамках проекта «Средства извлечения и быстрого поиска информации о бизнес-событиях в больших текстовых коллекциях» научной группе, отмечено пресс-службой ИТИС, предстоит провести исследование и прототипировать набор инструментов для контекстного поиска по неструктурированной информации. А также для проведения высококачественного, значимого и своевременного анализа и доставки знаний, полезных для всех заинтересованных пользователей IT-инфраструктуры, юридических подразделений и иных подразделений по управлению рисками.
Примером таких изысканий может стать фраза, говорящая о том, что некая компания произвела слияние с другой компанией. Из текста при исследовании можно выяснить тип события, его основные атрибуты и дополнительную информацию, вплоть до суммы сделки. Например, когда этот документ был опубликован. К слову, ученые работают над текстами на английском языке, в отношении русского все пока находится на стадии размышлений и разработок. По словам Серебрякова, такие исследования позволяют изучать информацию с минимальной временной задержкой и извлекать из нее богатые сведения. Изыскания питерской группы ученых сосредоточены в нескольких направлениях: слияние/поглощение, объявление компаний и людей, отставка и смена в должностной позиции. В научных разработках активно используются специальные словари, с помощью которых и идет расшифровка событий.
Казанские изыскания, напомним, рассчитаны на 6 месяцев. Между тем, КФУ и HP с марта 2009 года связывает протокол о намерениях. Его результатом стало создание на базе КФУ Центра технологий HP. Такие центры, отмечают в пресс-службе ИТИС, создаются в ведущих ВУЗах страны в рамках программы Международный «Институт технологий НР». Программа стартовала 25 января 2008 года и является уникальной для компании НР – она была придумана и ведется офисом открытых инноваций HP Labs. Эта реорганизация HP, предпринятая в марте 2008 года, ставит целью сотрудничество с академическими учреждениями и развитие технологий в образовании и науке при тесном партнерстве с бизнесом.
Оксана Ефимова,