регистрация

Главная

О портале

Инноваторы

Эксперты

Инвесторы

Новости

Индексы

О Республике Татарстан

Презентация

Нет презентаций

Информация

Финансирование

Предложение инвестору

Новости



ООО "Текстовая аналитика"

Общий рейтинг

0

Общая информация

Разработка масштабируемой программной платформы для 
эффективного извлечения структурированной информации из 
русскоязычных документов и индексирования извлеченной 
информации средствами поиска

Проект направлен на решение задачи извлечения структурированной информации из текстовых массивов больших объёмов. Актуальность широкого спектра задач в этой области возникает вследствие:

(а) возрастающих объёмов доступной текстовой информации как в Интернете, так и частных базах данных коммерческих и государственных организаций;

(б) необходимости компаниям приобретать конкурентные преимущества за счет внедрения автоматизированной обработки дополнительных источников неструктурированной информации для аналитики, оперативного принятия решений и оптимизации бизнеса.

В проекте делается упор на таком виде неструктурированных данных, как русскоязычные тексты.

 

Команда

Нет информации

Продукт

Ожидаемый результат проекта - программный инструментарий для решения базовых задач интеллектуального анализа русскоязычного текста, ориентированный на встраивание в продукты конечной текстовой аналитики. При разработке особое внимание уделяется эффективной программной реализации методов с поддержкой парадигмы распределенных вычислений и масштабируемости.

Анализ рынка

Выделяются два типа компаний:
1) имеющие собственную платформу текстовой аналитики и продающих конечные решения
2) предоставляющие доступ к платформе через облачный API.
Лидерами в первом сегменте являются компании Attensity и Lexalytics. 
Аналитическая платформа Attensity обладает следующими возможностями (для английского языка):
- интеграция с различными источники текстовой информации (социальные медиа, email, CRM),
- детальный анализ тональности,
- выявление трендов,
- прогностическая аналитика,
- генерация отчетов и визуализация данных.
Технология анализа текстов Lexalytics поддерживает 6 языков (исключая русский) и предоставляет следующие возможности:
извлечение именованных сущностей
анализ тональности (в том числе по каждой сущности) 
категоризация и кластеризация документов.
Кроме того, после приобретения Semantria API компания Lexalytics предоставляет облачный REST API на базе своей технологии.
Лидер в сегменте сервисов облачной текстовой аналитики Alchemy API предоставляет облачный REST API для таких задач, как извлечение (упоминание + типизирование) собственных имен людей, компаний, географических мест, продуктов, имен работ, URL и телефонных номеров; 
извлечение имен собственных, заданных пользователем; анализ полярности; извлечение фактов и отношений; категоризация текстов. Поддерживает 50 языков, включая русский. Базовый тарифный план позволит обработать примерно 5Гб/мес. за $250. К минусам можно отнести то, что часть функций для русского языка недоступна, нет возможности развернуть сервис на инфраструктуре клиента.

Распечатать
© 2013 Pulsar Venture