Как Pininterest создал один из самых успешных алгоритмов в Кремниевой долине

05.05.2020
Posted in blog-article
05.05.2020 admin

Как Pininterest создал один из самых успешных алгоритмов в Кремниевой долине

Немного запоздалый материал о том, как Pininterest борется с типичными для социальной сети проблемами: оскорбления, спам, фейковые новости. Какие у компании планы на будущее и удастся ли им создать отличный от их конкурентов способ взаимодействия с аудиторией?

О мощном инструменте рекомендаций компании и попытках избежать скандалов с их конкурентами.

Как и большинство социальных сетей, Pininterest был построен на предубеждениях и предположениях. Но в отличие от большинства социальных сетей, компания это не отрицает.

С самого начала, вы рассказываете компании как вас профайлить. Сервис задает несколько личных вопросов во время регистрации — ваш возраст и пол. В зависимости от того, как вы на них ответили, формируется ваш будущий контент. Основываясь на ваших ответах, а также на языке, регионе и частично на истории вашего браузера, Pininterest выбирает ряд категорий, которые, по его мнению, могут быть вам интересны, и просит оставить только пять из них.

Сообщаете Pininterest, что вы тридцатилетняя женщина, и он вам предлагает интересы, включающие в себя макияж, мастер-классы по прическам, планы тренировок и рецепты на ужин. Если вы скажете, что тридцатилетний мужчина, то вы получите несколько иные рекомендации: столярное дело, забавные картинки, навыки выживания и игры. Или же вы можете набрать свой собственный ответ в небинарной секции — это позволит включить туда все что угодно: вы получите нейтральные опции типа «животные», «декор дома», «прически» для женщин, мужчин, а также «длинные ногти».

Как Pininterest создал один из самых успешных алгоритмов в Кремниевой долине, изображение №2

Всего лишь один «пин» позволяет машинному обучению создать домашнюю ленту, наполненную картинками, которые, как оно предсказывает, подойдут именно вам. Это определяющий момент: Pininterest утверждает, что если люди видят картинки, которые им нравятся прямо в этот момент, есть большой шанс того, что они будут регулярно возвращаться на сайт за свежим контентом, который соотносится в их интересами, и просматривать рекламу, подобранную в соответствии с их интересами, и создавать доски из понравившихся пинов. Если людям не удалось найти что-то, что их интересует, с первого раза, в будущем они могут туда не вернуться.

Для 50 миллионов пользователей, которые присоединяются к Pininterest каждый год, это первое знакомство с одним из самых успешных в Кремниевой долине, но не до конца изученных алгоритмов. Код, который приводит в действие домашнюю ленту сайта, результаты поиска и оповещения, определяя какие изображения и идеи будут на очереди, схож с алгоритмам, что лежат в основе ленты Фейсбука, рекомендаций Youtube, и вашей страницы в TikTok. Это основной продукт для компании, стоящей 15 млрд. долларов и ставшей публичной в этом году.Это единственный стартап среди ряда таких единорогов, как Uber, Lyft, Slack, чьи активы продаются существенно выше цены на IPO.

Однако, за занавесом инженеры и исполнители Pininterest борются с теми же тенденциями, которые вызывают проблемы в любом другом месте. Лидеры компании говорят, что хотят обозначить иной маршрут для достижения успеха в Силиконовой долине, менее ослепительный и более гуманный. В первый год в качестве публичной компании, она столкнулась с первоочередным вызовом: Как выйти за рамки базы пользователей, которая исторически тяготеет к белым женщинам из пригородов? Как при этом не отпугивать преданных компании людей, не стереотипизировать новых пользователей, не благоприятствовать распространению дезинформации и радикализации?

Компания представила функцию, разработанную для устранения самого явного недостатка их алгоритма: тенденции к ложным заключениям, основанным на прошлом поведении пользователей. Таким образом их лента засорялась ненужным хламом, который они не хотели больше видеть: например, свадебное платье для пользователя, у которого была расторгнута помолвка, или детскиие вещи для пользовательницы, которая перенесла выкидыш. Нововведение, которое Pininterest назвал Home Feed Tuner, позволит пользователям в ручную редактировать интересы и историю просмотров, при необходимости сообщая алгоритмам что запомнить, а что надо забыть.

Это нововведение, которое ожидает Pininterest, уменьшит жалобы и увеличит удовлетворение среди небольшой группы активных пользователей. Но едва ли это поможет сайту расшириться. Это даже может привести к уменьшению числа взаимодействий для тех, кто использует этот алгоритм для ограничения информации, доступной для алгоритма. Это своего рода компромисс, на который компания намерена пойти. Особенно если учитывать факт, что ранние тесты показали значительный спад активности пользователей.

Однако, другие компромиссы предоставляются в более изощренной манере, например, как понимать пользователей настолько, чтобы они возвращались снова и снова, не наскучивая, не втюхивая им и не пугая их.

«Пользователи не хотят быть распределены в какую-то категорию», — говорит Кандис Морган, руководитель компании по вопросам инклюзивности и разнообразия. Ранее в этом году она заказала исследование для лучшего понимания, как Pininterest может лучше обслуживать пользователей отличного от их основной аудитории происхождения, которые представлены на данной платформе в недостаточной мере.»Они не хотят, чтобы мы догадывались, что им понравится, основываясь на их демографии», — добавляет Кандис.

Как Pininterest создал один из самых успешных алгоритмов в Кремниевой долине, изображение №3

Но до сих пор Pininterest догадывается, что понравится пользователям, основывась на их демографии. По крайней мере, в первые минуты после регистрации. Если алгоритм этого не делает, некоторая часть пользователей решит, что Pininterest не для них.

Далее возникли проблемы, которые поражают популярные социальные сети: дезинформация вирусным контентом, радикализация, обидные картинки и мемы, спам и теневые сайты, пытающиеся обыграть алгоритм с целью наживы. Со всеми напастями Pininterest справляется с разной степенью успешности. На этом моменте компания предпочла иной подход, в отличие от платформ-конкурентов: выявлять предрассудки, ограничивать виральность, и стала похожей на анти-социальную сеть.

До сих пор это работает.

***

Основанная в 2010 году тремя молодыми людьми, работниками Mountain View’s Hacker Dojo, Pininterest сначала испытывал проблемы с набором оборотов в качестве общепользовательской платформы для распространения коллекций изображений. Все изменилось, когда сооснователь Бен Сильберманн принял участие в конференции блогерок и инфлюенсерок, которые мгновенно взяли на вооружение эту платформу. Сайт прогремел в среде женщин и обитателей субурбий, которые нашли этот сайт идеальным местом для распространения рецептов, советов по стилю и DIY проектов вместе с идеями по декору дома.

Эти первые пользователи сформировали траекторию сайта. Так как разработчики компании следовали шаблонам социальных сетей, развивая алгоритмы персонализации, которые обучались на поведении пользователей, то платформа впитала их интересы и паттерны активности. Но слишком сильное доверие специфическим данным, полученным от первых пользователей, привело к некоторым проблемам. Например, вы можете застрять на доске, пестрящей свадебными платьями, где все модели белые.

Изначально домашняя лента показывала ряд самых популярных пинов со всех пользователей, основываясь на досках, на которые они подписаны, что было идеально для привлечения новых пользователей с схожими интересами, но не для разнообразия привлекательности сайта. «Мы столкнулись с неправильным представлением среди мужчин о том, что Pininterest — это то, что женщины используют для beauty-контента,» — говорит Морган, — «Хотя большое количество контента гендерно-нейтральное.»

Спустя годы Pininterest вынужден был изменить свою систему и алгоритмы, чтобы лучше идентифицировать и таргетировать различные группы пользователей и обозначать их интересы,т.е. вопрос о вашем поле, когда вы регистрируетесь, подборка тем, которая дает алгоритму первичное чувство того, чем вы интересуетесь, и может быть, несколько навязчивое использование данных браузера, которая может рассказать Pininterest, посещалили вы сайт до этого и как вы сюда пришли.

Вопрос о языке и регионе, например, помог Pininterest достичь аудитории за пределами США, которая до этого жаловалась, что платформа «ощущается чужеродной с момента регистрации.» Более половины пользователей сайта не из США, что справедливо и для других социальных сетей таких же размеров. В какой-то степени эти пользователи указывают путь для более инклюзивного Pininterest: в Японии, например, компания сообщает, что, похоже, в скором времени мужчины станут такими же активными пользователями как и женщины после посещения сайта в первый раз.

Но распределение пользователей на даже лучшие подгруппы несет в себе определенные риски, особенно для групп, которые исторически не были представлены в полной мере на сайте. Внутренние данные могут сказать нам, что состоятельные мужчины с кучей мачистских картинок поднимают рейтинги активности. Но эта статистика может не сообщить, что некоторая подгруппа мужских пользователей отстранена, или даже обижена скрытым допущением, что они заинтересованы в «холостяцких берлогах» и фотографиями «красивых знаменитостей», где присутствуют только женщины.

Pininterest работает над способами помочь пользователям увидеть себя в продукте. В январе компания запустила один из первых продуктов для развития инициативы по разнообразию, возглавляемой Морган и Омаром Сеялом, главой основного продукта Pininterest: инструмент для выбора цвета, который позволяет вам фильтровать beauty-результаты, основанные на цвете кожи.

Это замечательный первый шаг, но не идеальный, согласно исследованию компании. «Мы хотим понять, хотели бы пользователи активно предоставлять больше данных о себе, чтобы улучшить персонализацию. Мы выяснили, что их ответ «нет»: они только хотят, чтобы продукт работал для всех,» — говорит Морган.

Pininterest никогда не привлекал столько внимания СМИ, как предпочтения Facebook или Twitter, но это не значит, что он устойчив к проблемам, которые вызывают скандалы в любом другом месте. Один из их заметных критиков — это Майкл Каулфильд, эксперт по медиа грамотности и онлайн коммуникации в Вашингтонском государственном университете, в Ванкувере. в 2017 году он занимался политической культурой на Pininterest и обнаружил все самое ужасное, что можно найти на любой другой социальной платформе. Там были доски, полные фейковых новостей, этнических стереотипов и вопрос-ответов на конспирологические теории.

Каулфильд ругается, что агрессивный алгоритм рекомендаций Pininterest, совмещенный с доверием к пользовательским «доскам» связанных изображений, способен в считанные секунды превратить ленту пользователя в выгребную яму. «После всего лишь 14 минут использования браузера юзер, у которого было всего лишь несколько вопросов о вакцинах, может переместиться с пинов а-ля «Как сделать идеальную яичницу» к чему-то в духе реплик из Infowars*,» — пишет Каулфильд.

Одной из сторон проблемы является то, что спамеры переиграли алгоритм Pininterest, загружая вирусные политические мемы на те же доски что и, скажем, футболки, которые они хотят купить. Когда пользователи интересуются мемами, алгоритмы показывают им другие позиции на той же доске, которыми по идее они также могут интересоваться. В конечном счете, они показывают им футболки. Некоторые их покупают, и спамеры остаются в плюсе.

Каулфильд говорит, что он привык к tech-компаниям, которые игнорируют его критику или стараются ее сторониться. Но Pininterest его удивил: они поблагодарили его за выделение данной проблемы и пригласили его на встречу с исполнительными директорами компании, чтобы поделиться идеями по решению этой проблемы. И затем, по крайней мере в случае с анти-вакационной проблемой, они последовали его советам.

В августе Pininterest поменял то, как их поисковой механизм относится к запросам о вакцинах. Pininterest сказал, что теперь будет показывать только пины от крупных организаций здравоохранения, таких как Всемирная организация здравоохранения и Центр по контролю и профилактике заболеваний (CDC) США. Каулфильд одобрил шаг компании, которая заняла более решительную позицию, по сравнению с ее конкурентами. Это показывает, что компания намерена преодолеть несовершенства алгоритма, чтобы обратиться к системным проблемам, которые механизм не в состоянии решить.

До какой степени этот подход будет масштабироваться для всех других проблем, с которыми сталкивается платформа с 300 миллионами пользователей, еще предстоит выяснить. Но Pinterest, похоже, хочет это выяснить.

Традиционная мудрость среди социальных сетей заключается в том, что вы не можете возлагать слишком много ответственности на пользователей, чтобы персонализировать свои собственные каналы. Facebook поднялся до почти глобального доминирования, построив алгоритм новостной ленты, который лучше, чем сами пользователи, знает, на что они, вероятно, нажмут. Instagram и Twitter сопротивлялись алгоритмической ленте в течение многих лет, но оба в конечном итоге приняли автоматизацию и увидели, как их пользовательская база и финансовое состояние растут. Каждое действие, которое вы предпринимаете, еще больше совершенствует машину оптимизации взаимодействия, и предоставление пользователям доступа к ее рычагам только ускорит работу.

Pinterest, Как и другие социальные платформы, судит себя по таким показателям, как ежемесячные активные пользователи и скорость активации, как ясно видно из январского сообщения в блоге главного инженера роста. И исторически их алгоритм был безжалостен в совершенствовании ленты пользователей, чтобы показать им все больше и больше того, чем они были увлечены в прошлом. В связи с этим приведем знакомые критические замечания: оптимизация для взаимодействия может привести к бессмысленной или вызывающей зависимость прокрутке, а также может заманить пользователей в «пузыри» фильтров, наполненные дезинформацией или чем-то похуже.

Но что, если оптимизация взаимодействия не является вашей конечной целью? Это тот вопрос, который некоторые другие социальные сети, такие как Facebook и Twitter, только недавно начали задавать, поскольку они играют с более качественными целями, такими как “хорошо проведенное время” и “здоровые разговоры”. И это тот вопрос, который, как говорит глава основного продукта Pinterest Омар Сеял, проложил тропинку для нововведения, которое компания выпускает на этой неделе.

Одной из главных жалоб пользователей Pinterest в течение многих лет было отсутствие контроля над тем, что показывает им его алгоритм, говорит Сеял. «Вы нажимаете на что-то, и весь ваш канал становится этим.» Вопрос был в том, как решить его, не подвергая риску эффективность алгоритмов. «Каждый человек, который создает ленту для онлайн-платформы, скажет: » О, да, мы пытались сделать ее более управляемой. Но когда мы попытались запустить ее, она попрощалась с большим числом взаимодействий.”

В конце концов, Сеял говорит, что он решил, что это была совершенно неправильная постановка вопроса. Вместо этого он сказал инженерам, которым было поручено решить проблему управления пользователями, что им не нужно беспокоиться о последствиях от взаимодействия. Их единственной задачей было найти решение, которое уменьшило бы количество жалоб пользователей на чрезмерную корректировку ленты в ответ на их поведение.

Результатом этого проекта стала “Настройка вашей домашней ленты», которую он уже сделал доступной для некоторых пользователей. (Если он у вас есть, он появится здесь.) Позволяя пользователям настраивать то, как алгоритм реагирует на каждое из их действий, Pinterest предложит уровень настройки, который относительно немногие захотят использовать. Но Сеял говорит, что в ходе тестирования стало очевидно, что те пользователи, которые пишут жалобы, превалируют над теми, кто не хочет кастомизировать свою ленту. Они также оказались одними из самых преданных поклонников Pinterest. Пока тестирование не показало каких-либо существенных последствий для вовлеченности пользователей.

Теперь Сеял воспринимает это как урок. «Это призыв к другим платформам открыться для своих пользователей. Это сложная проблема, но люди все больше жаждут хороших решений.”

***

Pininterest теперь дает пользователям больше контроля, но, как и любая социальная сеть, которая полагается на алгоритмически управляемые рекомендации, она, в конечном итоге, опирается на своего рода предвзятость. В отличие от своих товарищей, Pinterest одобряет это — до тех пор, пока она имеет положительную коннотацию.

“В конце концов, мы являемся платформой для пользовательского контента», — говорит Сеял. “Мы не можем понять все, что происходит по пути к нам. У нас есть спамеры, у нас есть люди, которые хотят использовать платформу для распространения негативного контента. Какая-то его часть является рекламным.” То, что компания может сделать, чтобы смягчить эти проблемы, говорит он, — это внимательно посмотреть на типы контента, которые их система склонна усиливать, и настроить параметры алгоритма для приоритизации одних над другими.

Например, алгоритм Pinterest рассматривает «сохранение» данного пина как гораздо более положительный сигнал, нежели клики. «Люди на самом деле не сохраняют подстрекательскую статью о президенте, но они сохраняют наряд, который они хотят купить в будущем. Таким образом, мы склоняемся к этим типам взаимодействий и уклоняемся от взаимодействий с вашими друзьями.”

Уклонение от взаимодействия между друзьями может показаться странным подходом для сайта из категории социальных сетей. Но Pinterest говорит, что это часть того, как компания смягчила такие проблемы, как оскорбление и вирусная пропаганда. «В конечном счете, мы не видим дезинформирующих кампаний, как это делают другие платформы, потому что алгоритм просто не вознаграждает его», — говорит Малори Лючич, глава отдела коммуникаций Pinterest. “Когда вы пытаетесь массово спамить или запутать людей, вы, вероятно, хотите, чтобы этот контент попал на «первую страницу», и это просто не произойдет так легко на Pinterest.”

Даже в рамках категории кликов программное обеспечение компании рассматривает клики на” высококачественные » сайты как более ценные, чем клики на другие сайты. Всякий раз, когда Pinterest тестирует изменение алгоритма, Сеял говорит, что он смотрит на то, как это изменение влияет на исходящий трафик на выбранный вручную индекс авторитетных сайтов, которые сосредоточены на таких темах, как образ жизни, мода и домашний декор. (И в то время, как Facebook пытался установить «надежные источники» путем опроса пользователей, Pinterest признает, что он полагается на старомодное, субъективное, человеческое суждение.) Если изменение отправляет меньше трафика на эти сайты и больше на другие сайты, команда продукта будет исследовать, почему это происходит. Это может быть признаком того, что изменение открыло лазейку для менее авторитетных сайтов для игры с алгоритмом.

Данный тип преднамеренной модификации программного обеспечения-это то, что делают все основные социальные платформы, независимо от того, признают они это или нет. Критики, такие как Зейнеп Туфекчи, убедительно доказывают, что многие проблемы социальных сетей проистекают из их нежелания признавать фундаментальные предубеждения в своих алгоритмах: не в пользу либеральной политики или консервативной политики, а в пользу зрителей — для увеличения их числа.

Такие компании, как Google, Amazon, Facebook и Uber, славятся своими безграничными амбициями и, казалось бы, безграничным ростом. Сеял говорит, что у Pinterest тоже есть большие идеи. “Мы могли бы стать намного лучше в том, что мы делаем: новые форматы, новые виды взаимодействия, вещи, отличные от пинов.» Он считает, что будущее алгоритма Pinterest включает в себя не только отражение вкусов и стилей пользователей, но и помощь в их формировании, как это делают ведущие модные бренды. Он рассматривает плейлисты, созданные людьми в Spotify, такие как влиятельный RapCaviar, в качестве модели для подражания.

Но потом он останавливается и отступает. Ключевой момент для роста Pinterest, говорит он, чтобы помнить свои собственные ограничения. “Я думаю, что мы хотим быть хорошими только в том, в чем мы можем быть хорошими. Если вы хотите, чтобы каждый пользователь проводил каждый момент в вашем продукте, в этом чувствуется недостаток в сдержанности. Реальность такова, что технологические компании не могут делать все на Земле.”

____________________________________________________________________________________________

*InforWars — — ультраправый американский сайт, специализирующийся на фейковых новостях и конспирологических теориях. С контентом ресурса пытались бороться такие компании как YouTube, Facebook и Apple. InfoWars активно поддерживал Дональда Трампа во время его предвыборной кампании в 2016 году.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Contact

Давайте работать вместе!

Пишите нам и найдем точки соприкосновения, может станем партнерами, а может поможем вам зайти в нашу чудесную нишу

Вы разработчик?

Пишите! Нам постоянно нужны новые кадры, либо можем помочь в продвижении вашего приложения

Новичок?

Поможем быстро войти в нишу, не тратя годы на понимание

Давно в нише?

Рады будем пообщаться как на темы whitehat, так и blackhat тематики ^_^ + всегда есть что обсудить по поводу рекламных сетей

ПИШИ В TELEGRAM!

Contact