مجله خبری و آموزشی هوش مصنوعی

شکایت نیویورک تایمز از OpenAI و مایکروسافت؛ خسارت‌های میلیون دلاری

توسط مریم امیری
۰ اظهار نظر

نیویورک تایمز از OpenAI و شریک (و سرمایه‌گذار) نزدیک آن، مایکروسافت، به اتهام نقض قانون کپی رایت با آموزش مدل‌های هوش مصنوعی مولد در محتوای تایمز شکایت کرده است.

در دعوی که در دادگاه منطقه فدرال در منهتن تنظیم شده است، تایمز ادعا می کند که میلیون ها مقاله این نشریه برای آموزش مدل های هوش مصنوعی استفاده شده است. از جمله مواردی که زیربنای ChatGPT بسیار محبوب OpenAI و Copilot مایکروسافت هستند، به علت استفاده بدون بدون رضایت، تایمز از OpenAI و مایکروسافت می‌خواهد که مدل‌ها و داده‌های آموزشی حاوی مطالب توهین‌آمیز را «نابود کنند» و مسئول «میلیاردها دلار خسارت قانونی و واقعی» مربوط به «کپی و استفاده غیرقانونی از آثار ارزشمند تایمز» باشند. ”

تایمز در متن شکایت خود می‌گوید: «اگر تایمز و سایر سازمان‌های خبری نتوانند روزنامه‌نگاری مستقل خود را تولید و از آن محافظت کنند، خلایی ایجاد می‌شود که هیچ رایانه یا هوش مصنوعی نمی‌تواند آن را پر کند». روزنامه نگاران کمتری وجود خواهند داشت و هزینه آن برای جامعه بسیار زیاد خواهد بود.

سخنگوی OpenAI در بیانیه ای ایمیلی گفت: «ما به حقوق سازندگان و صاحبان محتوا احترام می گذاریم و متعهد هستیم که با آنها کار کنیم تا اطمینان حاصل کنیم که از فناوری هوش مصنوعی و مدل های درآمدی جدید بهره مند می شوند. گفتگوهای مداوم ما با نیویورک تایمز سازنده بوده و به شکلی سازنده پیش می رود، بنابراین ما از این پیشرفت شگفت زده و ناامید هستیم. ما امیدواریم که مانند بسیاری از ناشران دیگر، راه سودمندی برای همکاری با یکدیگر پیدا کنیم.»

مدل‌های هوش مصنوعی مولد از مثال‌ها تا مقاله‌ها، کدها، ایمیل‌ها، مقاله‌ها و موارد دیگر «یاد می‌گیرند» و فروشندگانی مانند OpenAI میلیون‌ها تا میلیاردها نمونه را در وب صیقل می‌دهند تا به مجموعه‌های آموزشی خود اضافه کنند. برخی از نمونه ها در حوزه عمومی هستند. بعضی نیستند، یا تحت مجوزهای محدود کننده ای هستند که به نقل قول یا اشکال خاصی از غرامت نیاز دارند.

فروشندگان استدلال می‌کنند که دکترین استفاده منصفانه محافظت کاملی را برای شیوه‌های خزش در وب آنها فراهم می‌کند. دارندگان حق چاپ موافق نیستند. صدها سازمان خبری اکنون از کدهایی استفاده می‌کنند تا از از اسکن وبسایت‌های خود توسط OpenAI، Google برای داده‌های آموزشی جلوگیری کنند.

تضاد فروشنده و خروجی منجر به تعداد فزاینده ای از نبردهای حقوقی شده است که تایمز آخرین مورد است.

سارا سیلورمن، بازیگر، در ماه جولای به یک جفت دعوی حقوقی پیوست که متا و OpenAI را متهم می‌کنند که خاطرات سیلورمن را برای آموزش مدل‌های هوش مصنوعی خود موذد سوءاستفاده قرار داده‌اند. هزاران رمان‌نویس، از جمله جاناتان فرانزن و جان گریشام، در یک طرح جداگانه، ادعا می‌کنند که OpenAI کار خود را به‌عنوان داده‌های آموزشی بدون اجازه یا دانش آن‌ها تهیه کرده است. و چندین برنامه نویس پرونده ای در حال انجام علیه مایکروسافت، OpenAI و GitHub به خاطر Copilot، یک ابزار تولید کد مبتنی بر هوش مصنوعی، که شاکیان می گویند با استفاده از آن توسعه یافته است، دارند. کد محافظت شده با IP آنها.

در حالی که تایمز اولین شرکتی نیست که از فروشندگان هوش مصنوعی مولد به دلیل نقض ادعای IP مربوط به آثار مکتوب شکایت می کند، اما بزرگترین ناشری است که تا به امروز درگیر چنین طرحی شده است – و یکی از اولین ناشرانی است که آسیب احتمالی به برند خود را از طریق “توهمات” یا حقایق ساخته شده از مدل های هوش مصنوعی مولد برجسته می کند.

شکایت تایمز به موارد متعددی اشاره می کند که در آن چت بینگ مایکروسافت (که اکنون Copilot نامیده می شود)، که زیربنای آن مدل OpenAI است، اطلاعات نادرستی ارائه کرده است که گفته می شود از روزنامه تایمز آمده است – از جمله نتایج مربوط به “۱۵ غذای مفید برای قلب”. ۱۲ مورد از آنها در هیچ مقاله تایمز ذکر نشده است.

تایمز همچنین این موضوع را مطرح می‌کند که OpenAI و مایکروسافت به طور مؤثر با استفاده از آثار تایمز رقبای نشر خبر ایجاد می‌کنند و با ارائه اطلاعاتی که معمولاً بدون اشتراک نمی‌توان به آن دسترسی پیدا کرد، به تجارت تایمز آسیب می‌رسانند. اطلاعاتی که همیشه دارای استنادات قوی نیست، چرا که گاهی اوقات این بخش از محتوا توسط همکاران فروش و یا به صورت رپورتاژهایی دارای کمیسیون منتشر می‌شوند.

همانطور که شکایت تایمز به آن اشاره می‌کند، مدل‌های هوش مصنوعی مولد تمایل به بازگرداندن داده‌های آموزشی دارند، برای مثال بازتولید تقریباً کلمه به کلمه نتایج از مقاله‌ها. فراتر از بازگشت، OpenAI حداقل در یک مورد به طور سهوی کاربران ChatGPT را قادر ساخته است تا محتوای خبری دارای محدودیت پرداختی را دور بزنند.

این شکایت می‌گوید: «مدافعان به‌دنبال این هستند که از سرمایه‌گذاری هنگفت تایمز در روزنامه‌نگاری خود استفاده کنند.

اثرگذاری منفی در کسب و کار اشتراک خبر- و ترافیک ناشران وب – موضوع اصلی یک شکایت مشابه نیز بوده است که ناشران در اوایل ماه جاری علیه Google ارائه کردند. در این پرونده، شاکیان، مانند تایمز، ادعا کرده‌اند، آزمایش‌های GenAI گوگل، از جمله ربات چت Bard مبتنی بر هوش مصنوعی و تجربه مولد جستجو، محتوای ناشران، خوانندگان و درآمد تبلیغات ناشی از ابزارهای ضدرقابتی را حذف می‌کند.

ادعاهای ناشران حقیقت دارد. یک مدل اخیر از The Atlantic دریافته است که اگر موتور جستجویی مانند گوگل، هوش مصنوعی را در جستجوی خود ادغام کند، در ۷۵ درصد مواقع به درخواست کاربر به طور کامل پاسخ می دهد بدون آن که نیاز باشد کاربر بر روی لینک وبسایت کلیک کند. بدین ترتیب ناشران تخمین می‌زنند ۴۰٪ از ترافیک سایت خود را از دست خواهند داد.

That doesn’t mean they’ll be successful in court. Heather Meeker, a founding partner at OSS Capital and an adviser on IP matters including licensing arrangements, compared The Times’ example of regurgitation to “using a word processor to cut and paste.”

این بدان معنا نیست که آنها در دادگاه موفق خواهند شد. هدر میکر، شریک موسس در OSS Capital و مشاور در IP matters بر اساس مجوز توافقات، مثال تایمز از بازگشت مجدد را با “استفاده از پردازشگر کلمه برای برش و چسباندن” مقایسه کرد.

میکر از طریق ایمیل به TechCrunch گفت: «نیویورک تایمز در شکایتش، نمونه‌ای از جلسه ChatGPT درباره بررسی رستوران در سال ۲۰۱۲ را ارائه می‌کند. درخواست برای ChatGPT این است که “بندهای آغازین بررسی او چه بود؟” درخواست های بعدی به طور مکرر “جمله بعدی” را درخواست می کنند. اذیت کردن یک چت‌بات برای بازتولید ورودی، مبنای معقولی برای نقض حق نسخه برداری نیست… اگر کاربر عمداً این کار را انجام دهد. کپی کردن گفتگو در چت‌بات، تقصیر کاربر است. و به همین دلیل است که اکثر [دعواهای حقوقی مانند این] احتمالاً شکست خواهند خورد.»

برخی از خبرگزاری ها، به جای مبارزه با فروشندگان هوش مصنوعی مولد در دادگاه، مجوز قراردادها را با آنها امضا کرده اند. آسوشیتدپرس در ماه جولای قرارداد با OpenAI منعقد کرد و اکسل اسپرینگر، ناشر آلمانی که مالک Politico و Business Insider است نیز به همین ترتیب این ماه یک قرارداد با این شرکت امضا کرد.

تایمز در شکایت خود می‌گوید که تلاش کرده تا در ماه آوریل با مایکروسافت و OpenAI به توافقی برای صدور مجوز دست یابد، اما مذاکرات در نهایت مثمر ثمر نبوده است.

 

این مطالب هم پیشنهاد می‌شود

پیام بگذارید