Привет всем любителям крипты! Мы публикуем наш Whitepaper! Скоро пресейл!
(картинка: фильм Терминатор, ну вы поняли))
Читайте в pdf Whitepaper стартапа GraphGrailAi (на русском)
На сайт: http://graphgrail.com
А также заходите к нам в Телеграм: https://t.me/GraphGrailAi
Форум БиткоинТолк: https://bitcointalk.org/index.php?topic=2016928
Что мы делали 2 предыдущие недели я описывал в постах:
https://golos.id/ru--startapy/@bitcoinking/ico-realiti-shou-vykhodim-na-ico-nedelya-2
https://golos.id/ru--kriptovalyuty/@bitcoinking/ico-vykhodim-na-ico-realiti-shou-startapa-ai-blockchain-nedelya-3
Далее я скопирую текст вайтпепер, вы можете прочитать его на Голосе. Но если вам хочется оригинального оформления - удобнее в пдф.
GraphGrail Ai (Графовый Грааль ИИ) – это первая в мире платформа Искусственного интеллекта для Блокчейна, построенная на базе технологий обработки естественного языка с маркетплейсом децентрализованных приложений.
http://graphgrail.com Telegram: https://t.me/GraphGrailAi Golos: https://golos.id/@bitcoinking Steemit: https://steemit.com/@gromozeka
МИР ИЗМЕНИЛСЯ
Не смотря на то, что банки разных стран, а также их правительственные регуляторы давно изучают возможности использования технологий Blockchain в своих операциях, именно Сингапур оказался впереди, на практике проверив эффективность применения Blockchain Согласно отчету, опубликованному Валютным Управлением Сингапура, данный проект теперь известен как «Project Ubin». Это проект Blockchain, целью которого является создание цифровой, токеновой версии сингапурского доллара. Project Ubin по сути партнерская программа центрального банка и консорциума R3.
R3 является альянсом более 70 компаний и финансовых учреждений со всего мира. Он был создан в 2015 году с целью разработки технологии Blockchain и использования ее для расширения возможностей следующего поколения глобальных финансов. Его главным достижением до сих пор является платформа Blockchain под названием Corda, миссия которой заключается в том, чтобы облегчить и стандартизировать финансовые операции между учредительными фирмами. Проект Ubin стартовал в марте 2017 года, и первый его этап уже завершен. Система позволила банкам менять цифровые криптовалютные потоки на наличные деньги, что собственно и собирается в будущем делать центральный банк Сингапура.
Помимо центрального банка Сингапура, многие крупные банки, также начали работу с технологией Blockchain. Согласно сообщению Reuters, одним из первых технологию Blockchain начал изучать Bank of America, который в партнерстве с Microsoft интегрировал эту технологию. По сообщениям CNBC, японские банки в этом году также приняли на вооружение технологию Blockchain. К ним относятся AEON Bank, Nomura Trust Banking и Mizuho.
Приятно отметить, что Россия не только не отстает, но и в чем то опережает многие ведущие государства мира. В частности такие российские банки как Сбербанк России и ВнешЭконом Банк (ВЭБ), не просто изучают, а уже активно внедряют технологии Blockchain в своей деятельности. Ну и одной самых громких новостей, которая просто ошеломила криптовалютное сообщество и также привела к резкому скачку курса Эфира, была новость о состоявшейся встрече президента России Владимира Путина и основателя Ethereum Виталика Бутерина.
Один из крупнейших в мире инвестиционных банков Goldman Sachs создает сайт где разьясняется преимущество технологии блокчейн (http://www.goldmansachs.com/our-thinking/pages/blockchain/), перед традиционной банковской системой. Представители компании объявили об активной работе в данном направлении. В Южной Корее началась подготовка новых законодательных актов, призванных ввести в правовое поле операции с криптовалютами. При этом новое регулирование может оказаться достаточно жестким, сообщает The Korea Herald. По информации издания, представитель правящей Демократической партии Пак Йон Чжи готовит три новых законопроекта, которые создадут нормативно-правовую базу для хождения в стране криптовалют биткоина и Ethereum.
Правительства и корпорации все чаще понимают, что блокчейн — идеальное средство для оптимизации собственных реестров. Политики, стремящиеся сделать более прозрачным и надежным институт частной собственности в Гондурасе, попросили американский блокчейн-стартап Factom разработать на основе новой технологии земельный кадастр. Интерес к идее проявило и правительство Греции, находящееся в совсем безнадежном положении: земельный кадастр страны адекватно отражает только 7% ее территории.
Испанский банк Santander (10-е место по активам в мире) утверждает, что сможет использовать блокчейн в двух десятках рабочих процессов внутри банка. Применение технологии, по подсчетам аналитиков Santander, может к 2022 году сократить издержки финансовых организаций на $15–20 млрд, в первую очередь за счет экономии на трансграничных платежах, торговле ценными бумагами и комплаенсе. Прочие мировые финансовые гиганты — Goldman Sachs, JP Morgan и Credit Suisse и еще шесть транснациональных банков — планируют разработать общие стандарты для технологии блокчейна и найти возможности для применения в секторе финансовых услуг. Реализовывать свои взгляды на технологию они собираются в рамках стартапа R3CEV, войдя в его капитал. Рост числа транзакций могут обеспечить не только государства и корпорации, но и множество мелких компаний.
Например, американский стартап Everledger собирается записывать в открытый реестр данные об уникальных отличительных признаках бриллиантов. В случае если камень будет украден, запись обеспечит неоспоримое доказательство собственности. Это лишь некоторые из крупных имен, которые уже начали работать над этой новой технологией. По мере развития криптоконверсии эксперты прогнозируют, что технология Blockchain, по сути, будет распространяться через различные отрасли промышленности даже за пределами банковского и финансового сектора. Однако банки и финансовый сектор определенно возглавят первую волну.
ЧТО ТАКОЕ GRAPHGRAIL AI
Графовый Грааль ИИ – это первая в мире платформа Искусственного интеллекта для Блокчейна, построенная на базе технологий обработки естественного языка с маркетплейсом децентрализованных приложений. Наша миссия: создание сильного Искусственного интеллекта, который был бы открыт для всего сообщества, контролировался и развивался усилиями разработчиков со всего мира. Мы разрабатываем платформу анализа больших объемов текстовых данных, решающую задачи извлечения знаний и сложной смысловой классификации на основе машинного обучения, нейронных сетей и технологий Deep learning с приоритетным фокусом на рынках банковского сектора, био-технологий и медицины, безопасности и соблюдения законодательства. Ключевой элемент платформы - универсальный конструктор для сложных классификаций по смыслу текста – Ai-designer.
В течение 2х лет наша команда проводила исследования и разработки (R&D) сфере анализа естественного языка (NLP), извлечения знаний (Information Retrieval) и обучения искусственных нейронных сетей. Результатом стал конструктор языковых моделей: он позволяет любому пользователю просто кликами мыши создать модель и обучить нейронную сеть для самых разнообразных задач. Область применений широка: от моделей спама до различения стилей текста, от поиска фейков на базе языковых атрибутов до проверки сложных условий в умных контрактах на блокчейне. Важной особенностью платформы является то, что она предоставляет полный цикл работы с данными: от сбора, разметки и до конечного результата. Руководители бизнеса, владельцы стартапов, разработчики, data-science специалисты получат в свое распоряжение богатый API и возможность создавать кастомные аппликейшены (apps) для интеграции в свои сервисы и приложения. Таким образом, мы даем другим компаниям сделать на нашем сервисе решение и применять его уже в своем бизнесе. Пользователи со всего мира без специальных знаний получат возможность зарабатывать на платформе, создавая, улучшая и голосуя за языковые модели. Для этого в проекте реализуется токен GGL, базирующийся на блокчейне Ethereum. При этом модели могут быть различные: сложная смысловая классификация, предсказательные или же лучшие воркфлоу для обучения нейросетей.
Для не технарей: физически лингвистическая модель представляет собой файл, размером от 15мб и до 1.5Гб, в среднем. Это может быть результат обучения нейросети или комплекс обработчиков онтологии предметной области. Добро пожаловать в Голубой океан – экосистему Искусственного интеллекта, позволяющую бизнесу реализовывать стратегию внедрения постоянных инноваций (Continuous innovation), развиваться и выходить на новые рынки.
ВВЕДЕНИЕ: ОБЗОР ТЕХНОЛОГИИ
GraphGrail Ai -designer - унифицированная аналитическая платформа, позволяющая бизнесу и госструктурам решать задачи анализа и классификации больших объемов текстовых данных, предоставляя конечный продукт и удобное API.
Сегодня отрасль потоковой аналитики текстовых данных переживает период
бурного роста, среди клиентов, заинтересованных в анализе данных представлены
и сегменты банковской отрасли, телеком, ритейл, стартапы в области чат-ботов и
госструктуры: избиркомы, центры экспертиз, политические партии. Задачи, которые
стоят перед ними разнообразны: это и задачи классификации (агитация, спам, мошенничество) и задачи извлечения знаний (аналитика продуктов и услуг).
Сервис в рамках единого окна предоставляет конструктор лингвистических моделей,
который позволяет быстро и без программирования создать онтологию (модель)
предметной области и тут же, на базе сервиса проводить многократное тестирование модели, дополняя ее и улучшая ее точность и полноту.
Основное преимущество сервиса в том, что он обеспечивает клиенту полный цикл работы с данными: начиная от сбора данных и обучения искусственной нейронной сети до вывода конечного результата в веб-интерфейсе или отчетах нужного формата.
КЛЮЧЕВАЯ ПРОБЛЕМА РЫНКА ИСКУСТВЕННОГО ИНТЕЛЛЕКТА
Сегодня на рынке нет ни одного сервиса полного цикла, обеспечивающего возможность создания лингвистических моделей без программирования. Как правило, эта задача решается другими компаниями с привлечением программистов и занимает от 5 до 12 месяцев для одной предметной области. Почему так долго? Фундаментальная проблема рынка аналитики текстовых данных, машинного обучения и практики использования нейронных сетей: данных нет. Давайте пошагово рассмотрим, как бизнес решает задачу, например, анализа своих продуктов и услуг в сравнении с конкурентами: 1. По многим отраслям нет общедоступных баз текстовых данных: их требуется собрать, очистить, обезличить. 2. Даже если данные есть, их не хватает: требуется от нескольких тысяч до миллионов образцов, для того, чтобы применять машинное обучение. 3. Данные не размечены под задачу: требуется десятки человеко-часов для разметки – только после этого можно применять большинство алгоритмов обучения. 4. Теперь можно обучить нейросеть. Но только один раз. 5. Данные быстро устаревают: требуется постоянное обновление текстовых массивов актуальной информацией, а для этого нужно дополнить модель, то есть пройти шаги 1-4. 6. И все это время бизнес оплачивает работу специалистов, которые, как правило, дорого стоят и работают только тогда, когда требуется переобучать модель.
РЕШЕНИЕ
Рис 1. Архитектура сервиса GraphGrail Ai В сервисе реализуются два модуля: модуль прагматического анализа смысла текста и
модуль обучения нейронной сети.
Прагматический модуль архитектурно включает в себя 3 уровня анализа текстовых данных: морфологический анализ, синтаксический и высокоуровневый прагматический анализ, основывающийся на нашей разработке.
Модуль нейронной сети включает себя методы и средства обучения нейронной сети на данных, предварительно обработанных в Прагматическом модуле.
Благодаря такой модульной архитектуре обработки текстовых данных сервис позволяет:
1. Сокращать время разработки лингвистических моделей под предметную отрасль
2. Накапливать и инкрементно улучшать качество обученной нейронной сети, производить многократное переобучение сети,
3. Выявлять сложные составные лингвистические атрибуты (фичи - features), именованные
сущности, относящиеся к конкретной предметной области.
Таким образом, система реализует разработанную нами методику обработки текстовых данных, и дает новый качественный результат: анализ и классификацию сложных смысловых данных. Современные нейросети для успешного обучения требуют обучающие датасеты большого размера. Они не умеют что-то понимать с одного или нескольких примеров. Это затрудняет их использование в тех областях, где больших датасетов не создано. В то же время, человеку нередко бывает достаточно пары частных примеров, чтобы сделать глубокое обобщение. Обобщать по маленькому количеству семплов современным сетям мешает переобучение (overfitting). Оно заключается в том, что когда образцов мало, а предметная область сложная (т.е. для её описания нужно много параметров), то сеть вместо глубокого обобщения запоминает частные случаи. В результате на обучающей выборке она показывает хорошие результаты, а на тестовой плохие, так как там другие частные случаи. Проблема тем больше, чем больше параметров у сети (проклятие размерности), и чем меньше обучающих семплов. Существует три подхода к решению проблемы: регуляризация, архитектурные хитрости, перенос знаний (Transfer learning). Технические и научные решения, которые будут реализованы в нашем продукте смогут эффективно решать задачу внутреннего переноса знаний с помощью предобученных моделей и семантических категорий. Таким образом проблема one-shot обучения (one-shot learning) может быть успешно решена. [1]
КЕЙСЫ ДЛЯ БЛОКЧЕЙН-КОМПАНИЙ
Платформа GraphGrail Ai представляет собой мета-сервис, призванный кардинально ускорить создание новых компаний и стартапов в сфере анализа данных.
Кейсы использования:
1) Сервис будет полезен внутри Блокчейн экосистемы. Для смарт-контрактов, чтобы проверять, выполнилось ли внешнее условие. А условия могут быть самые разнообразные, связанные с объектами внешнего мира, людьми, компаниями и их взаимодействиями: · встречи бизнесменов и политиков, · заключение договоров, · покупка или продажа компаний, · судебные решения, · отслеживание цепочки поставок, · анализ новостного фона и фондового рынка, · изменение погоды, · наступление срока. С помощью Оракулов для смарт-контрактов платформа GraphGrail Ai автоматизирует таким образом проверку условий смарт-контрактов и снижает риски арбитражных разбирательств между контрагентами.
2) Обеспечение безопасности при заключении договоров. В умном контракте могут быть прописаны условия форс-мажора, которые наступают в исключительных случаях. Требуется автоматическая проверка этих условий на основании внешних доверенных источников с анализом неструктурированной информации.
Например: две компании заключили договор о поставках. Однако внешние условия существенно изменились: это могут быть погодные условия (сильный ветер, низкая температура, влажность и пр.), политические (отмена или принятие закона) или ситуационные (другой поставщик не смог доставить комплектующие).
Платформа GraphGrail Ai решает задачу предоставления данных умному контракту путем доступа к внешним источникам: СМИ, социальным сетям, Википедии и др., производит сбор и анализ данных, важных для контракта и предоставляет контракту основание для решения: исполнять его или нет. То есть это процедура, обеспечивающая фундамент матчинга для транзакций.
Реализация предполагается на сайдчейн. Сайдчейн (sidechain) — это новый блокчейн, базирующийся на родительской биткоин-цепочке (например). Сайдчены реализуют новые финансовые экосистемы посредством интеграции в биткоин, что отличает их от других криптовалют, игнорирующих уже существующие сети. Используя сайдчейны, мы легко можем создавать разного рода умные финансовые контракты, акции, фьючерсы, деривативы и многое другое. На базе биткоина можно создать бесчисленное множество сайдчейнов с разными задачами и особенностями, активы которых будут зависеть от волатильности основной цепи. Основываясь на этом, сайдчейн способствует дальнейшему расширению области применения и инновационного пространства для технологии блокчейн. Это позволяет традиционным блокчейн поддерживать несколько видов активов, небольшие платежи, умные контракты, безопасное проведение транзакций, регистрацию прав реальной собственности и др., а также увеличивает степень конфиденциальности блокчейн-транзакций.
Рис 2. Основная проблема смарт-контрактов: на шаге 2 смарт-контракт почти никогда не может достоверно проверить выполнение условия из внешнего мира Смарт-контракты с помощью обученного ИИ станут действительно умными.
3) Эквайринг, кредитование и бухгалтерский учет тоже будут использовать умные контракты — например, для оценки рисков и аудита в режиме реального времени. Юристы смогут перейти от составления традиционных контрактов к созданию типовых образцов умных контрактов. Также сервис решает большое количество задач бизнеса, по сути это конструктор ИИ - позволяет разработчикам самим создавать решения для конкретного бизнеса (как облачная платформа Microsoft Azure, конструктор для игр Unity или конструкторы сайтов типа Wix).
4) Предиктивная аналитика. На базе Steemit и Голос кастомное решение сможет собирать и анализировать посты про криптовалюты и предоставлять дашбоард-советник с функцией помощи в трейдинге и уведомлениями об опасности падения крипты в зависимости от тональности новостей. 5)
Персональный анализ спама и фильтрация интересных сообщений (Big data). Например, в Телеграм в каждом активном чате появляется по 100-200 сообщений в час, прочитать которые у пользователя не хватит времени, даже при наличии такого желания. Требуется решение по поиску полезных сообщений для каждого тематического чата и для каждого отдельного пользователя – ведь у каждого человека цели нахождения в чате различаются. Кто-то будет использовать решение GraphGrail Ai для поиска бизнес-предложений, кто-то отслеживает новости, кто-то мониторит релевантный опыт участников и т.п. GraphGrail Ai это "мозг" для блокчейна.
КЕЙСЫ ДЛЯ СУЩЕСТВУЮЩЕГО БИЗНЕСА
Сейчас сервис используется для аналитики для бизнеса и госструктур: задачи типа анализа продуктов бизнеса (проблемы с продуктами, негатив и тп), поиск агитации, поиск противоправных высказываний. В ближайшее время традиционный бизнес начнет масштабный переход на технологию Блокчейн и GraphGrail Ai будет готов предоставить все те услуги и сервисы по аналитике данных, к которым бизнес привык до бума блокчейн-технологий:
· Сервисы распознавания речи. Аудио транслируется в текст – далее можно применять сервис для аналитики сказанного.
· Сервисы для банков. Для анализа и поиска мошенничества в постах, а его бывает большое количество разновидностей: с картами, с банками, с телефонами, и везде свои нюансы. Система сама найдет эти посты, без ручного чтения текста.
· Госструктуры. Анализ социума, проведение исследований и аналитика мнений широких масс. Избирательные комиссии могут использовать сервис для выявления неправомерной агитации.
· Политики. Политические партии, депутаты, сенаторы и конгрессмены смогут использовать сервис для мониторинга общественного мнения о персонах, события и явлениях.
· Фейковые новости. Фальшивые (поддельные, «фейковые») новости это информационная мистификация или намеренное распространение дезинформации в социальных медиа и традиционных СМИ с целью введения в заблуждение, для того чтобы получить финансовую или политическую выгоду. Авторы поддельных новостей часто используют броские заголовки или полностью сфабрикованные истории для увеличения читательской аудитории и цитируемости. Крупнейшие компании из медиа-отрасли включились в борьбу с фейками, в том числе и Facebook. Но проблема заключается в том, что часто до проверки фактов установить подлинность новости нельзя. GraphGrail Ai предоставляет инструмент для разработки модели выявления фейков на основании лингвистических атрибутов, свойственных ненастоящим новостям.
· Мошенничество. GraphGrail Ai способен адаптироваться к изменяющимся условиям в бизнесе и выявлять сообщения или жалобы о мошенничестве в самых различных отраслях, в том числе и новых, по которым еще нет исторических данных.
· Вопрос-ответные системы. GraphGrail Ai решает задачу умного помощника для операторов служб поддержки, подбирая ответы, релевантные вопросам и существенно сокращая время и сложность поддержки тысяч пользователей.
РЫНОК: ОБЪЕМ И ПЕРСПЕКТИВЫ
По данным, изложенным в обзорной статье Forbes рынок аналитики данных ожидает бурный рост [2]. По данным аналитиков компании IDC [3] весь мировой рынок (PAM) анализа больших данных составит в 2019 году 187 млрд. долл. с ростом более 50% в пятилетний период. К 2020 году предсказательная аналитика привлечет 40% валовых инвестиций в области решений для бизнеса. По данным компании Wikibon [4] рынок Big Data вырастет c 18.3 млрд. долл. в 2014 году до 92.2 млрд. долл. с ежегодным ростом (CAGR) в 14.4%.
Рис 3. Рост сектора Больших данных составит 14.4% в год Компания IDC также предсказывает [5], что глобальные затраты на когнитивные системы достигнут около 31.3 млрд. долл. с темпами ежегодного роста (CAGR) в 55%. Более 40% затрат на когнитивные системы пойдет на софт, включающий комплексные когнитивные решения (а именно: текст и обогащенные медиа данные, тегирование, поиск, машинное обучение, категоризацию, кластеризацию, генерацию гипотез, вопросно-ответные системы, визуализацию, фильтрацию, сигнализирование и навигацию).
Рис 4. Доходы мирового рынка анализа данных по сегментам Сервис 451 Research's Total Data Market Monitor также предсказывает [6] рост рынка анализа данных до 132 миллиардов долларов в 2020 году. Статистический сервис Статиста предсказывает [7] доходы рынка Искусственного интеллекта к 2025 году в размере 59 миллиардов долларов. По данным исследований http://ideya.eu.com/publications.html,
http://экономикарунета.рф/2014/ и http://www.cossa.ru/articles/149/17590/ рынок аналитики текстовых данных в России растет на 15% в год.
Рис 5. Доходы мирового рынка Искусственного интеллекта, с 2016 по 2025 годы (в миллионах долларов США). Revenues from the artificial intelligence (AI) market worldwide, from 2016 to 2025 (in million U.S. dollars) Основными драйверами рынка являются социальные сети (в том числе и будущие блокчейн гиганты вроде Status), мессенджеры, стартапы, разрабатывающие чат-ботов, умных помощников. Среди ключевых клиентских сегментов мы выделяем: 1. Пользователей Kaggle –платформы для проведения конкурсов по машинному обучению 2. Пользователей StackOverflow – крупнейшего ресурса вопрос-ответов для разработчиков 3. Читателей тематических стартап-ресурсов: VentureBit, Vc.ru, ProductHunt 4. Читателей криптовалютных ресурсов: Forklog, Bits Media, CoinSpot, CoinTelegraph, CoinDesk, Bitcoin Magazine, CoinJournal
КОНКУРЕНТЫ
Среди мировых конкурентов: · IBM купил AlchemyAPI за $100млн., март 2015 (стал основой Watson) · «Ростелеком» купил «Айкумен ИБС» за 525млн. руб., ноябрь 2015 · Google купил API.ai, сентябрь 2016 Стартапы в области обработки данных продолжают привлекать инвестиции, из недавних можно отметить: Narrativescience, Versive, Dataminr. Стоит отметить и новый блокчейн-стартап Numer.ai, который решает проблему переобучения для специалистов по данным, однако он является скорее партнером, чем конкурентом. Косвенные конкуренты: сервисы, которые занимаются мониторингом социальных сетей. Однако они, как правило, не предоставляются аналитику, кроме простого позитива/негатива. Это сервисы: Юскан, Семантикфорс, Вобот.
Важно, что некоторые сервисы конкурентов, хотя и являются мощными, не предоставляют сложной смысловой аналитики, их возможности ограничиваются извлечением именованных сущностей (Named Entity Recognition). Они не предоставляют удобных интерфейсов для работы с текстовыми данными, часто приходится использовать несколько различных решений, сталкиваясь с проблемами экспорт-импорта данных и т.п. Они также недостаточно хорошо работают с русским и другими флективными языками, то есть языками со свободным порядком слов.
МОНЕТИЗАЦИЯ
Сервис предоставляется по бизнес-модели SaaS - программное обеспечение как услуга.
Используется модель подписки с оплатой помесячно, за полгода, год.
Мы предоставляем гибкие тарифные планы, в зависимости от объема обрабатываемых данных в мес., сложности аналитики, количества источников и др.
Также отдельно тарифицируются запросы к API.
РАСПРЕДЕЛЕНИЕ ТОКЕНОВ НА ICO
Средства, полученные при продаже токенов GGL пойдут на финансирование маркетинговой кампании и запуск маркетплейса языковых моделей. Всего будет выпущено 1,000,000,000 (1 миллиард) токенов GGL. 19% (190,000,000) будут храниться в резервном фонде. 20% (200,000,000) остаются за командой GraphGrail Ai для обеспечения разработки и развития продукта. Эти токены будут находиться на мильтисигнатурных кошельках. 1% (10,000,000) будут выплачены на баунти-кампанию и маркетинг. 60% (600,000,000) будет продано инвесторам. ICO будет проходить поэтапно в следующем порядке:
1) Пресейл (июль 2017) На пресейле будет продано 100 млн. токенов GGL.
Капитализация: $200,000 Цена 1 GGL = $0.02
2) ICO (сентябрь 2017) На ICO будет продано от 60 до 600 млн. токенов GGL.
Капитализация составит Минимум: $6,000,000 Максимум: $50,000,000
Цена 1 GGL = $0.1
Рис 6. Схема распределения токенов Средства пойдут на выход на мировой рынок, поддержку премиум аккаунтов, партнерские отчисления, поддержку команд разработчиков, которые будут создавать продукты на платформе GraphGrail Ai.
НАУЧНЫЙ И ТЕХНОЛОГИЧЕСКИЙ СТЕК
1. Применение векторных предобученных моделей - word2vec и doc2vec. Данные векторные модели позволяют реализовывать автоматическое определение смысловой близости слов - синонимы и антонимы.
2. Методика latent Dirichlet allocation (LDA) - позволяет определять близость тематик документов.
3. Собственная разработка: методика конструирования лингвистических моделей с
использованием онтологии - позволяет извлекать структурированные знания. Мы используем целый набор отношений: таксономию (категория-подкатегория), часть-целое и др.
4. Специализированные программные инструменты для обучения искусственных нейронных сетей (RNN, LSTM) с возможностью сохранения итоговой модели в файл: gensim (тематическое моделирование) и sklearn (пакет для научной обработки данных и машинного обучения)
ПРЕИМУЩЕСТВА ДЛЯ РАЗРАБОТЧИКОВ МОДЕЛЕЙ
В процессе изучения рынка аналитики данных, машинного обучения и практики использования нейронных сетей мы выяснили главную "боль": чтобы обучить нейронную сеть нужно а) десятки и сотни тысяч экземпляров текстовых данных, до миллионов, в зависимости от задачи и б) эти данные должны быть качественно размечены, то есть разработчики должны создать обучающие и тестовые выборки (training set, test set) - это все разработчикам приходится делать вручную.
Проблему поиска датасетов каждая компания решает своими средствами - как правило, таких датасетов нет в открытом доступе. В то время, как для лингвистов есть открытые корпуса текстов, вроде НКРЯ и др., для многих отраслей человеческой деятельности таких корпусов нет, а это означает, что нужно затрачивать сотни человекочасов работы программистов в каждой компании, желающей извлекать знания из текстовых данных.
Команда GraphGrail Ai также столкнулась с этой проблемой при разработке модели для одного из своих клиентов: готовых размеченных датасетов нет в открытом доступе, к тому же разметка очень сложная, необходимо учитывать множество составных фич при определении языковых атрибутов. Наша разработка решает эту фундаментальную проблему и предоставляет простой и понятный интерфейс для создания модели предметной области и последующего машинного обучения. Прямых аналогов в настоящее время нет.
Вот какие преимущества получают пользователи платформы:
1. Применение не только для анализа брендов, можно адаптировать под любую отрасль: обнаружение нарушений законодательства в сети, оскорблений, противоправных высказываний и намерений, фейковых новостей, манипулирования мнением и пр.
2. Есть умная аналитика, которая позволяла делать настраивать сервис по предметную область клиента ему самому с помощью конструктора, что сокращает время обработки данных их соц. сетей и повышает качество этих данных. Мы используем наш конструктор, который учитывает морфологию русского языка, леммы, биграммы, сложные согласования (по роду, числу, падежу).
3. Предоставление API - даем программный интерфейс для тех, кто не хочет пользоваться веб-интерфейсом или у кого специфические задачи. Такой подход является фундаментом для разработки сильного Искусственного интеллекта: будут доступны специальная функциональность, обеспечивающая «скрещивание» различных моделей.
МАРКЕТПЛЕЙС МОДЕЛЕЙ И ЭКОНОМИЧЕСКИЙ СТИМУЛ
Токены выдаются за создание, улучшение и тестирование языковых моделей. Так как юзеры будут создавать модели и делиться ими нужна публичная база, которая была бы защищена он злонамеренного изменения этих моделей.
Преимущество использования технологии blockchain по сравнению с классической разработкой закрытого проекта: существенно ускоряется разработка ИИ, теперь над задачей работает не узкая команда из 5 специалистов дата-сейенс, а привлекаются сотни тысяч разработчиков со всего мира.
Интеграция с блокчейн-медиаплатформами позволит системе обращаться к блокчейну и брать данные для обучения искусственной нейронной сети. Маркетплейс решений для бизнеса для языковой сферы, даст разработчикам полную свободу для "скрещивания" моделей друг с другом и получения новых решений. По аналогии с блокчейн-медиаплатформами Steemit и Голос (golos.io) токены выплачиваются пользователям в соответствии с внутренней формулой, основными параметрами которой являются: · Усредненная сложность модели: количество слов и оборотов в ней · Сложность предметной области · Наличие или отсутствие публичных датасетов для предметной области · Размер датасета для обучения и разметки · Сложность разметки датасета · Количество слоев в искусственной нейронной сети · Количество эпох обучения нейросети · Показатели precision и recall для конечного результата при тестировании на данных · Востребованность решения бизнесом · Количество запросов к API, необходимое для бизнес-задачи В соответствии с принципами справедливости платформа является поставщиком сервиса для конечных разработчиков и позволяет в рамках партнерства зарабатывать на продаже доступа к API. При этом вся интеллектуальная собственность, созданная с помощью платформы принадлежит GraphGrail Ai.
ДОРОЖНАЯ КАРТА
Июль 2017 г.: - GraphGrail Ai кампания по пресейлу токенов
Август 2017 г. - масштабное тестирование продукта на пилотных проектах, - подготовка к публичному запуску первой версии, - маркетинговая кампания и подготовка к пре-сид раунду GraphGrail Ai
Сентябрь 2017 г. - публичный запуск первой версии сервиса, - проведение ICO GraphGrail Ai
Октябрь - Декабрь 2017 г. - полномасштабный запуск платформы и библиотеки лингвистических моделей с доступом через программные интерфейсы (API), - Начало работы с английским языком, - Нагрузочное тестирование платформы - Запуск маркетплейса языковых моделей
Первый квартал 2018 г. - Начало партнерства с топовыми компаниями Блокчейн-индустрии: Status, Sonm, Tierion, Oraclize - тестирование и подключение 2го языка для платформы - масштабирование - запуск премиум аккаунтов и адаптивная формула вознаграждения делегатов - Регистрация ИС и патента
КОМАНДА
Смотрите в пдф, пришлось убрать, т.к. Голос имеет лимит на пост...
ПРАВИЛА И УСЛОВИЯ
(также в пдф)
СПИСОК ИСТОЧНИКОВ
1. https://habrahabr.ru/post/302214
2. https://www.forbes.com/sites/louiscolumbus/2016/08/20/roundup-of-analytics-big-data-bi-forecasts-and-market-estimates-2016/
3. https://www.idc.com/getdoc.jsp?containerId=prUS41306516
4. http://siliconangle.com/blog/2016/03/30/wikibon-forecasts-big-data-market-to-hit-92-2bn-by-2026/
5. http://www.informationweek.com/big-data/big-data-analytics/big-data-analytics-sales-will-reach-$187-billion-by-2019/d/d-id/1325631
6. https://451research.com/report-short?entityId=89339&referrer=marketing&utm_source=website_homepage&utm_medium=website&utm_term=data_platforms_analytics&utm_content=apply_for_trial&utm_campaign=2016_market_insight
7. https://www.statista.com/statistics/607716/worldwide-artificial-intelligence-market-revenues/
Это на самом деле крутая новость, поделюсь...
Надеюсь, что всё пройдет гладко. И с запуском, краудсейлом и с работой сервиса в дальнейшем..
У меня как у не технаря вопрос только один - насколько быстро такой сервис станет необходим большинству обычных компаний?
Работаем надо запуском.
Я бы так сказал: это сильно зависит от нашей способности продвигать продукт. Рынок абсолютно новый, многие компании-клиенты еще не вышли сами на рынок.
А компании "старого" образца, они будут потребителями той части сервиса, которая делает анализ языка, без блокчейна. Вопрос будет стоять как именно мы будем с ними интегрироваться.
Я думаю, что на маркетинг, конференции и прочее уйдет до 1 года времени, прежде чем пойдет массовый спрос.
Понятно, спасибо за ответ) буду за вами "следить" в хорошем смысле слова, интересно..))
Интересный проект, подпишусь!
Добавь в конкуренты cyberFund :-)
Ваш пост поддержали следующие Инвесторы Сообщества "Добрый кит":
polyideic, andrvik, bitclabnetwork, bobrik, on1x, vika-teplo, myhardmoney
Поэтому я тоже проголосовал за него!
Узнать подробности о сообществе можно тут:
Разрешите представиться - Кит Добрый
Правила
Инструкция по внесению Инвестиционного взноса
Вы тоже можете стать Инвестором и поддержать проект!!!
Если Вы хотите отказаться от поддержки Доброго Кита, то ответьте на этот комментарий командой "!нехочу"
Интересный проект + отдельное спасибо за по истине хороший вайтпепер. Будем наблюдать и участвовать.
В бумаге есть небольшая неточность в цифрах, в ICO токенов должно быть от 60 до 500 млн вместо 600 млн, по идее.
Очень много букв, надеюсь что там много важного. Честно не читал, но поддерживаю, думаю ты старался.
Когда и где можно купить токены на пресейле?
@bitcoinking Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:
Награда за Количество комментариев
Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь
Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом
стоп