Специалисты компании Google в своём последнем исследовании рассказали, что научили ИИ предсказывать, будет ли та или иная фотография эстетически приятна человеку. Алгоритм также может подсказывать, что нужно сделать с изображением, чтобы оно сильнее понравилось людям. Разработчики надеются, что когда-нибудь ИИ станет лучшим советчиком для фотографов.
Традиционно алгоритмы сортируют изображения по базовым показателям, чтобы найти заданное. Например, смотрят, есть ли на фотографии кошка. Новое исследование Google показывает, что теперь ИИ может оценивать изображение вне зависимости от категории.
Может показаться нереальным, что возможно научить робота понимать красоту изображения так же, как это умеет делать человек. Но последние разработки доказывают, что машинное зрение всё ближе приближается к человеческому. Правда, в большинстве случаев его применяют в более прикладных целях, чем оценка красоты картин.
Например, в настоящий момент работают над ИИ, который сможет управлять не только автомобилем, что уже кажется почти обыденностью, но и космическим аппаратом. Первые испытания уже даже провели, хотя в них пока победил человек.
Кстати, недавно было опубликовано видео о том, как работает машинное зрение с технологией распознавания лиц и предметов. Нейросеть протестировали на улицах Нью-Йорка, и глядя на эти кадры становится трудно понять, что делать: восхищаться технологиями или начинать бояться их.
Надо сказать - надо ещё выделить кошку.
Это таки тоже задача - хотя и неплохо решаемая этими нашими свёрточными сетями.
Это таки тоже задача - хотя и неплохо решаемая этими нашими свёрточными сетями.
Чёрную кошку в темноте, или кошку под ногами
Ну это уже точно overhuman уберменшевый ИИ.
не важно. можно еще сиськи добавить
>Разработчики надеются, что когда-нибудь ИИ станет лучшим советчиком для фотографов.
Но мы то с вами знаем что это подрастающий скайнет мира маркетинга.
Но мы то с вами знаем что это подрастающий скайнет мира маркетинга.
У вас горизонт завален.
вот когда ИИ будет расстреливать за вертикальное видео, тогда и случится настоящая революция
Кстати, недавно было опубликовано видео о том, как работает машинное зрение с техн бла бла
видео в студию. хочу бояться
видео в студию. хочу бояться
"Кстати, недавно было опубликовано видео о том, как работает машинное зрение с техн бла бла видео в студию."
Видео не будет, но в случае свёрточных сетей (недавно вроде выстрелили капсульные, но это не точно и, ЕМНИП, они были какими-то совершенно медленными) как-то так (конкретные шаги отличаются в зависимости от сети):
- проходим по изображению, допустим, 30 фильтрами размера 3x3, допустим. Теперь исходное изображение 512x512x3 (например, не всегда нужен хайрез) стало матрицей 170x170x30
- делим эту матрицу на регионы, например, 2x2 - 85x85x2x2x30. От каждого региона берем максимальное значение.
- повторяем пока не надоест. На самом деле, конечно, нет - пока мы можем получить сеть, способную обучаться на наших данных.
- дальше всё зависит от задачи - можем мы классификатор строим, а может в автоэнкодер пытаемся.
Т.е. выходит как-то так:
- на нижних слоях выделяем признаки типа, например, линий
- дальше - размеры покрываемых областей исходного изображения (и признаки) всё усложняются. Пусть это будет, например, глаз.
"хочу бояться"
Да ладно, просто заведи себе ручного леопарда с картинки ниже
Видео не будет, но в случае свёрточных сетей (недавно вроде выстрелили капсульные, но это не точно и, ЕМНИП, они были какими-то совершенно медленными) как-то так (конкретные шаги отличаются в зависимости от сети):
- проходим по изображению, допустим, 30 фильтрами размера 3x3, допустим. Теперь исходное изображение 512x512x3 (например, не всегда нужен хайрез) стало матрицей 170x170x30
- делим эту матрицу на регионы, например, 2x2 - 85x85x2x2x30. От каждого региона берем максимальное значение.
- повторяем пока не надоест. На самом деле, конечно, нет - пока мы можем получить сеть, способную обучаться на наших данных.
- дальше всё зависит от задачи - можем мы классификатор строим, а может в автоэнкодер пытаемся.
Т.е. выходит как-то так:
- на нижних слоях выделяем признаки типа, например, линий
- дальше - размеры покрываемых областей исходного изображения (и признаки) всё усложняются. Пусть это будет, например, глаз.
"хочу бояться"
Да ладно, просто заведи себе ручного леопарда с картинки ниже
Идеально.
Они научили ИИ любить котиков?
Насколько я помню скандал с Faceapp и еще парой приложений помельче, проблема в "красивости" будет в первую очередь с жирным лобби толерастов и "анти"расистов, которые будут жаловаться что белые, худые и здоровые лица в среднем приятнее.
Если ИИ будет обучаться по реакции юзера, то разным людям/группам он будет показывать разные картинки.
Правда все равно будет весело, когда жир-позитивщицам будет показывать худышек, а ярым гомофобам - геев.
Правда все равно будет весело, когда жир-позитивщицам будет показывать худышек, а ярым гомофобам - геев.
Чтобы написать коммент, необходимо залогиниться
Это и есть алгоритм?