Джину К. Варгезе 1, Падма Рани 2
Цифровой ориентализм в машинном зрении: кроссплатформенный анализ репрезентаций индийской культуры, сгенерированных искусственным интеллектом
2024,
т. 23,
№ 4,
с. 113–139
[содержание номера]
Данное исследование рассматривает интерпретацию и воспроизводство элементов индийской культуры современными системами формирования изображений, основанными на искусственном интеллекте, на примере сравнительного анализа трех крупных ИИ-платформ: Stable Diffusion, Flux и Midjourney. Несмотря на примечательные технические возможности, продемонстрированные данными системами, их обращение с элементами незападных культур остается недостаточно изученным. Мы представляем новую методологическую рамку из визуальной социальной семиотики и цифровой антропологии для анализа сгенерированных искусственным интеллектом изображений по множеству параметров, таких как точность репрезентации, учет культурных особенностей и динамика отношений власти. Проведенный нами систематический анализ изображений, генерируемых в ходе постоянно усложняющихся запросов, выявляет наличие значительных шаблонов, возникающих при репрезентации культуры данными системами. Результаты исследования говорят о том, что, несмотря на различающееся техническое совершенство, показываемое этими платформами, они всякий раз демонстрируют предвзятость в производстве человеческих образов, особенно в части их гендерной, классовой и этнической идентичности. Анализ раскрывает систематическое упрощение сложных культурных элементов и неизменно сохраняющуюся ориенталистскую перспективу, несмотря на развитие технических возможностей. Предлагаемые выводы свидетельствуют о том, что для настоящего воспроизводства культуры недостаточно одного лишь технического совершенства; необходимо скорее фундаментальное переосмысление того, как данные системы обрабатывают и понимают культурную информацию. Данное исследование предлагает как теоретический вклад в вопросы цифровой репрезентации культур, так и практические выводы для разработки более внимательных к культурным особенностям систем искусственного интеллекта, а также показывает важные области для совершенствования технической архитектуры моделей генерации изображений.
Ключевые слова:
цифровой ориентализм;
искусственный интеллект (ИИ);
репрезентация культуры;
визуальная социальная семиотика;
индийская культура;
машинное зрение;
цифровая антропология;
постколониальное вычисление