Я смотрю, поиск по голосу не находит упоминаний DeepLineageBot - а это такая модная игрушка, надо об этом написать! Так называется бот в телеграме, который по селфи определяет этнические корни человека. Натренировали робота на фотках википедии, поэтому там есть определенная несимметричность в данных, - очевидно, фоток не-белых людей там наверняка меньше, значит модель будет по ним менее точной.
Например, я залил две своих фотки - примерно одинаковых, но одна с бородой, а вторая - нет. Так вот борода сразу превратила 8% от моей европейскости частично в африканскость (6%), а частично - в еврейскость (2%). При том, что у меня нет не только еврейских корней, но даже африканских. Ну то есть, насколько можно верить тесту ДНК от 23andMe. Хотя у них тоже статистические методы со своими погрешностями, конечно.
Смеху ради и для иллюстрации приведу анализ фотки, опубликованной на Голосе, - тоже с бородой. Уж простит меня ее герой. Бедный бот аж растерялся от такой бороды - то ли араб, то ли латино.
Источник тоже не забудьте почитать, он очень трогательный
Это, кстати, еще одно применение машинного обучения - вот тут я об этом рассказывал.
Еще раз адрес бота - DeepLineageBot
PS Что-то copy-paste emoji для бороды дают мне битые символы.
В словах "европейскость" и "африканскость" корень - "кость". Примерно как в выражении "белая кость".
Меня он вообще упорно негром считает =)
Подумал еще, что разработчики бота специально могли оставить цифры по этническим смесям выше, чем уместно было бы в реальном приложении, - и ну и false positives вообще. Потому что это делает бота более фановым и обсуждаемым.
То есть он просто не удаляет темную бороду из оценки цвета кожи. А если борода белая?
Да ну, вряд ли дело в этом. Там же не алгоритм, а машинное обучение. По идее, оно должно контуры анализировать, а не цвет. Просто в википедии больше бородачей среди евреев и чернокожих, думаю.
Ну, для определения негроидной расы фактор цвета кожи имеет очень большой цвет. Я так думаю. )
Как нет? А как же Адам Сын Земли и Ева Дарующая жизнь из Эдема?
Разделение произошло позже.
Напомнило старую шутку (реальный случай), как гугл определил людей к гориллам.
Ну да, плохо обученный алгоритм.