ABBYY опубликовала исходный код своей библиотеки машинного обучения

ABBYY опубликовала исходный код своей библиотеки машинного обучения

23.06.2020     

Компания ABBYY выложила на GitHub исходники своей нейросети, используемой для распознания текста. Программный код открыт под свободной лицензией Apache 2.0.

Нейросеть для бизнеса

Библиотека машинного обучения NeoML выложена на GitHub для того, чтобы ускорить развитие облачных, десктопных и мобильных решений, применяющих нейросети. Она позволяет разработчикам дополнять свои приложения новыми возможностями. В ABBYY библиотека используется для продуктов, нуждающихся в компьютерном зрении, обработке естественных языков в структурированных и неструктурированных документах. 

NeoML поддерживает инструменты ONNX, благодаря чему может быть легко интегрирована в сторонние фреймворки. Стандарт поддерживается Microsoft, Facebook и другими компаниями и поэтому полностью совместим с другими решениями организаций. 

Константин Гольдштейн, ведущий эксперт по стратегическим технологиям Microsoft в России, отмечает, что NeoML позволяет программистам получить доступ к ряду возможностей, в которых нуждаются современные бизнес-приложения. Интеграция с ONNX открывает перспективы создания обширной экосистемы разработчиков вокруг проекта ABBYY.

Особенности библиотеки

NeoML поддерживает и классический метод машинного обучения, и глубокий. Библиотека может быть использована в облачной или мобильной средах. Ее нейросети применяют до 100 слоев, а для классического машинного обучения доступно более 20 алгоритмов.

Модели, создаваемые при помощи решения, пригодятся в задачах идентификации, классификации, семантической сегментации, прогнозирования. Например, банковские приложения на основе NeoML могут поддерживать функцию прогнозирования спроса на финансовые услуги. 

Еще одна отличительная черта библиотеки ABBYY – кроссплатформенность. NeoML совместима с устройствами на базе Windows, Linux, macOS, iOS и Android. Расчеты могут производиться и на центральных процессорах, и на графических. При работе с GPU в ОС от Microsoft необходима видеокарта, поддерживающая архитектуру параллельных вычислений CUDA версии 10.2. Для iOS нужен процессор модели A7 или старше. Android-устройства для применения NeoML нуждаются в поддержке API Vulkan 1.0. На macOS и Linux использовать GPU для машинного обучения пока что нельзя. 

Для работы с NeoML необходимо знание С++, Java, Objective C или Swift. Разработчики обещают в скором времени добавить поддержку Python. Внутренние тесты ABBYY продемонстрировали, что скорость библиотеки на задачах обработки изображений превышает аналоги на 15-20%.


Купить продукты ABBYY на Инфостарте



Источник: https://infostart.ru/journal/news/tekhnologii/abbyy-opublikovala-iskhodnyy-kod-svoey-biblioteki-mashinnogo-obucheniya_1254615/
Автор:
Александр Вашкевич Аналитик


Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. Darklight 27 29.06.20 14:06 Сейчас в теме
И можно это теперь как-то прикрутить к 1С? Да ещё и бесплатно?
rbdaurov; +1 Ответить
3. s22 19 07.07.20 19:22 Сейчас в теме
(1)
И можно это теперь как-то прикрутить к 1С? Да ещё и бесплатно?

Есть TENSORFLOW и отлаженее и есть стыковки со всем и библиотек куча.
Есть Torch по факту он стандарт.

Смысл в этой библиотеке?
4. Darklight 27 08.07.20 09:32 Сейчас в теме
(3)Возможно, я не совсем понял для чего применяется данная библиотека. Я себе сразу представил нейросети для распознавания текста :-(

Честно, когда-то давно, интересовался этой темой, на тот момент (около 7-10 лет назад) - отсканированный русский текст (в т.ч. в печатных документах) распознавал относительно сносно только aBBY - у них есть API для программного подключения (на том момент это было OLE-automation, и стоило баснословных денег - намного дороже любой пользовательской интерактивной лицензии), вот я и подумал, что теперь это можно было бы прикрутить к 1С бесплатно.... условно бесплатно - сразу понял, что тут сырой (в смысле RAW) алгоритм - и все рюшечки по его практическому применению для распознавания сложных документов придётся всё-равно прикручивать самостоятельно "сверху" - и это не так уж просто - что в очередной раз задумаешься о покупке готового бизнес-API.

С другой стороны - даже если это всего лишь абстрактное машинное обучение - это тоже хорошо - ибо "своё" "родное" "отечественное" мне вот больше греет душу... чем западное - главное, чтобы не государственное было.... так что будут ждать появления встроенной поддержке нейростетей и машинного обучения в возможно будущей платформе 1С Предприятие 9.5 - лет так через 50 :-] главное дожить и дождаться =/
5. s22 19 08.07.20 09:54 Сейчас в теме
(4)
С другой стороны - даже если это всего лишь абстрактное машинное обучение - это тоже хорошо - ибо "своё" "родное" "отечественное" мне вот больше греет душу... чем западное - главное, чтобы не государственное было.... так что будут ждать появления встроенной поддержке нейростетей и машинного обучения в возможно будущей платформе 1С Предприятие 9.5 - лет так через 50 :-] главное дожить и дождаться =/


Удивительно, но ядро библиотеки пишется за неделю и оно будет сравнимо по качеству с имеющимися.
Библиотеки распознавания дофига. Тот же Tesseract. Я использовал его для распознавания в 1с. Сейчас с нейросетями это не проблема.
2. frkbvfnjh 603 30.06.20 07:00 Сейчас в теме
Когда встроят в документооборот?
Оставьте свое сообщение

См. также

Нейросеть научили писать код на С и С++

Новость Искусственный интеллект ИТ-новость

Популярной нейросети GPT-2 нашли новое применение. Ее научили генерировать фрагменты кода на С и С++, и даже опытный разработчик не всегда отличит эти листинги от реальных.

05.03.2021    1434    user1015646    2       

Самые медленные языки программирования с динамической типизацией

Новость ИТ-новость Языки программирования

Скорость выполнения программы зависит не только от аппаратной части, но и от языка, на котором она написана. Однако, не все языки программирования могут похвастаться высокой скоростью выполнения кода. Расскажем о некоторых подробнее.

03.03.2021    1643    SKravchenko    3       

Мэрия Москвы разработала мессенджер для замены Telegram и Skype

Новость Импортозамещение ИТ-новость Мессенджеры

Российская компания ID Partner совместно с правительством Москвы создала приложение TDM Messenger. Согласно описанию, оно позволяет полностью заменить другие мессенджеры, в том числе Telegram и Skype.

02.03.2021    2513    VKuser24342747    8       

Совсем взрослый стал: Python исполнилось 30 лет

Новость ИТ-новость Языки программирования

Python является самым молодым из наиболее популярных языков программирования. Впрочем, все относительно: на днях Python исполнилось 30 лет.

02.03.2021    1164    user1015646    1       

Энтузиасты создали для популярного эмулятора патч с поддержкой процессоров «Эльбрус»

Новость ИТ-новость Микроэлектроника Новости компаний

Свободный эмулятор QEMU получил неофициальную поддержку отечественной архитектуры процессоров «Эльбрус». В разработке реализовано около 80% набора инструкций «Эльбрус-8С».

01.03.2021    2016    VKuser24342747    0       

Российский разработчик создал неофициальную версию Clubhouse для Android

Новость Android ИТ-новость Мессенджеры Мобильные приложения

Бывший разработчик из «ВКонтакте» Григорий Клюшников выпустил приложение для Android, предоставляющее доступ к большинству функций Clubhouse. Официально соцсеть доступна только пользователям iOS.

26.02.2021    2302    VKuser24342747    0       

Масштабное обновление Trello: пять новых видов досок и интеграция с Google Docs

Новость ИТ-новость Новости компаний

Компания Atlassian выпустила масштабное обновление сервиса управления проектами Trello. Разработчики изменили дизайн, добавили пять новых видов досок и реализовали для карточек возможность отображать информацию из сторонних сервисов.

25.02.2021    4166    user1015646    0       

Видеоигра на базе нейросетевого генератора текстов стала бизнес-консультантом

Новость Видеоигры Искусственный интеллект ИТ-новость

Энтузиаст использовал возможности текстового квеста, генерирующего разнообразные миры при помощи нейросети GPT-3, чтобы получать советы по ведению бизнеса. Часть идей ИИ оказалась пригодной для использования.

25.02.2021    2612    VKuser24342747    1       

В ближайшие годы возрастет потребность в персонале центров обработки данных

Новость Дата-центры ИТ-новость Цифровая экономика

Согласно отчету Uptime Institute, количество сотрудников, необходимых для обеспечения работы ЦОД, вырастет с 2 млн. в 2019 году до 2,3 млн. в 2025 году.

24.02.2021    2235    SKravchenko    0       

Google кардинально изменит дизайн Android 12

Новость Android Google ИТ-новость Мобильные приложения Новости компаний

Компания Google анонсировала глобальное обновление популярной операционной системы Android. Новая версия выйдет под номером 12. Говорят, что Android 12 назовут «Snow cone» – летний десерт из сладкого колотого льда.

24.02.2021    2685    mouse187    0       

Google представила новый сервис для поиска уязвимостей в открытом ПО

Новость Google Безопасность ИТ-новость

Компания Google запустила платформу с открытым исходным кодом OSV (Open Source Vulnerabilities). Она создана для поиска и закрытия уязвимостей в свободном ПО.

18.02.2021    1430    user1015646    0       

Отечественная компания представила сервер приложений Java EE

Новость ИТ-новость Новости компаний Языки программирования

Российская компания Bellsoft представила отечественный аналог сервера Oracle и IBM для JavaEE. Раньше продукт на базе открытого кода был доступен только для некоторых клиентов организации.

17.02.2021    2445    VKuser24342747    4       

Rustоманы из Долины: Google, Microsoft, Huawei, Mozilla и AWS основали фонд поддержки языка программирования

Новость Google ИТ-новость Новости компаний Языки программирования

Rust – перспективный язык, который широко применяется в разработке операционных систем и высоконагруженных веб-сервисов. Rust Foundation будет заниматься поддержкой и развитием языка.

16.02.2021    1680    user1015646    0       

В Microsoft Teams появилась платформа для общения и обучения

Новость Интернет ИТ-новость Мессенджеры Новости компаний

Microsoft добавила новые функции в корпоративный мессенджер Teams. В подключенной к нему платформе Viva можно пройти обучение, пообщаться с коллегами или улучшить организацию работы.

15.02.2021    3243    user1015646    0       

Google рассказала, как защищает Android от взломов

Новость Android Google Безопасность ИТ-новость

Google опубликовала информацию о том, как компания пытается улучшить безопасность Android, и какие шаги предпринимаются для борьбы с распространенными угрозами. Отчеты об уязвимостях играют в этом значительную роль.

12.02.2021    1989    SKravchenko    0       

Для регионов разработают приложение онлайн-записи на прием к врачам

Новость ИТ-новость Медицина Минкомсвязь Цифровая экономика

О возможностях приложения рассказали в Минздраве и Минцифре.

10.02.2021    1994    Senator_I    2       

Google разработает новую мобильную ОС

Новость MobileOS Google ИТ-новость Мобильные приложения

Корпорация Google создаст мобильную операционную систему для повышения безопасности использования устройств. Проект запущен под рабочим названием microdroid.

09.02.2021    2251    user1015646    0       

Google закрывает собственную игровую студию Stadia

Новость Google Видеоигры ИТ-новость Новости компаний

1 февраля Google официально закрыл собственную студию разработки игр для проекта Stadia, чтобы сосредоточить внимание на технологиях, лежащих в основе платформы.

09.02.2021    1603    SKravchenko    0       

Google представила технологию для замены cookies

Новость Google Интернет ИТ-новость

Методы сбора файлов cookies для повышения точности подбора рекламы не раз упрекали в нарушении личного пространства пользователей. Компания Google представила технологию, которая позволит отказаться от cookies и повысить уровень конфиденциальности.

09.02.2021    1342    user1015646    0       

Украинская команда FireWay одержала победу в хакатоне NASA Space Apps Challenge 2020

Новость ИТ-новость Стартапы

Украинская команда FireWay из Днепра стала победителем международного хакатона NASA Space Apps Challenge. Их изобретение было описано как «решение, которое демонстрирует наиболее инновационное использование технологии».

05.02.2021    2070    SKravchenko    2       

Китайцы разработали целых две альтернативы Flash

Новость Интернет ИТ-новость

Китайцам пришлось разработать собственную технологию ReFla взамен Flash для предотвращения сбоев в работе систем. Также они выпустили доработанную версию Flash Player с кодом 34.0.0.92.

04.02.2021    2235    mouse187    4       

Популярные дистрибутивы Linux могут лишиться поддержки Chromium

Новость Linux Google Интернет ИТ-новость

Из дистрибутивов Arch Linux, Fedora, Debian, Slackware и openSUSE может исчезнуть поддержка браузеров на движке Chromium. Причина – жесткие правила Google, из-за которых возникли проблемы с синхронизацией данных.

03.02.2021    2524    user1015646    3       

Microsoft участвует в разработке цифрового паспорта вакцинации от Covid-19

Новость ИТ-новость Медицина

Крупнейшие корпорации из сектора здравоохранения и ИТ-гиганты, такие как Microsoft, Salesforce и другие, объединились для создания цифровых идентификационных карт, которые подтверждают статус вакцинации против Covid-19.

02.02.2021    1891    capitan    3       

Что нового в Chrome 88: проверка надежности паролей и поддержка профилей

Новость Google Интернет ИТ-новость

Компания Google представила новый релиз браузера Chrome и обновила движок Chromium. Теперь ПО будет предупреждать о небезопасных паролях, а пользователь сможет создать привязанный к учетной записи профиль для персонализации работы в сети.

01.02.2021    2354    user1015646    0       

280 символов для науки: Twitter откроет доступ ученым к архиву твитов

Новость ИТ-новость Соцсети

Twitter предоставит академическим исследователям социальных сетей бесплатный доступ почти ко всем твитам. Исключение площадка сделает только для заблокированных аккаунтов.

29.01.2021    1588    VKuser24342747    1