نیویورک تایمز از OpenAI و شریک (و سرمایهگذار) نزدیک آن، مایکروسافت، به اتهام نقض قانون کپی رایت با آموزش مدلهای هوش مصنوعی مولد در محتوای تایمز شکایت کرده است.
در دعوی که در دادگاه منطقه فدرال در منهتن تنظیم شده است، تایمز ادعا می کند که میلیون ها مقاله این نشریه برای آموزش مدل های هوش مصنوعی استفاده شده است. از جمله مواردی که زیربنای ChatGPT بسیار محبوب OpenAI و Copilot مایکروسافت هستند، به علت استفاده بدون بدون رضایت، تایمز از OpenAI و مایکروسافت میخواهد که مدلها و دادههای آموزشی حاوی مطالب توهینآمیز را «نابود کنند» و مسئول «میلیاردها دلار خسارت قانونی و واقعی» مربوط به «کپی و استفاده غیرقانونی از آثار ارزشمند تایمز» باشند. ”
تایمز در متن شکایت خود میگوید: «اگر تایمز و سایر سازمانهای خبری نتوانند روزنامهنگاری مستقل خود را تولید و از آن محافظت کنند، خلایی ایجاد میشود که هیچ رایانه یا هوش مصنوعی نمیتواند آن را پر کند». روزنامه نگاران کمتری وجود خواهند داشت و هزینه آن برای جامعه بسیار زیاد خواهد بود.
سخنگوی OpenAI در بیانیه ای ایمیلی گفت: «ما به حقوق سازندگان و صاحبان محتوا احترام می گذاریم و متعهد هستیم که با آنها کار کنیم تا اطمینان حاصل کنیم که از فناوری هوش مصنوعی و مدل های درآمدی جدید بهره مند می شوند. گفتگوهای مداوم ما با نیویورک تایمز سازنده بوده و به شکلی سازنده پیش می رود، بنابراین ما از این پیشرفت شگفت زده و ناامید هستیم. ما امیدواریم که مانند بسیاری از ناشران دیگر، راه سودمندی برای همکاری با یکدیگر پیدا کنیم.»
مدلهای هوش مصنوعی مولد از مثالها تا مقالهها، کدها، ایمیلها، مقالهها و موارد دیگر «یاد میگیرند» و فروشندگانی مانند OpenAI میلیونها تا میلیاردها نمونه را در وب صیقل میدهند تا به مجموعههای آموزشی خود اضافه کنند. برخی از نمونه ها در حوزه عمومی هستند. بعضی نیستند، یا تحت مجوزهای محدود کننده ای هستند که به نقل قول یا اشکال خاصی از غرامت نیاز دارند.
فروشندگان استدلال میکنند که دکترین استفاده منصفانه محافظت کاملی را برای شیوههای خزش در وب آنها فراهم میکند. دارندگان حق چاپ موافق نیستند. صدها سازمان خبری اکنون از کدهایی استفاده میکنند تا از از اسکن وبسایتهای خود توسط OpenAI، Google برای دادههای آموزشی جلوگیری کنند.
تضاد فروشنده و خروجی منجر به تعداد فزاینده ای از نبردهای حقوقی شده است که تایمز آخرین مورد است.
سارا سیلورمن، بازیگر، در ماه جولای به یک جفت دعوی حقوقی پیوست که متا و OpenAI را متهم میکنند که خاطرات سیلورمن را برای آموزش مدلهای هوش مصنوعی خود موذد سوءاستفاده قرار دادهاند. هزاران رماننویس، از جمله جاناتان فرانزن و جان گریشام، در یک طرح جداگانه، ادعا میکنند که OpenAI کار خود را بهعنوان دادههای آموزشی بدون اجازه یا دانش آنها تهیه کرده است. و چندین برنامه نویس پرونده ای در حال انجام علیه مایکروسافت، OpenAI و GitHub به خاطر Copilot، یک ابزار تولید کد مبتنی بر هوش مصنوعی، که شاکیان می گویند با استفاده از آن توسعه یافته است، دارند. کد محافظت شده با IP آنها.
در حالی که تایمز اولین شرکتی نیست که از فروشندگان هوش مصنوعی مولد به دلیل نقض ادعای IP مربوط به آثار مکتوب شکایت می کند، اما بزرگترین ناشری است که تا به امروز درگیر چنین طرحی شده است – و یکی از اولین ناشرانی است که آسیب احتمالی به برند خود را از طریق “توهمات” یا حقایق ساخته شده از مدل های هوش مصنوعی مولد برجسته می کند.
شکایت تایمز به موارد متعددی اشاره می کند که در آن چت بینگ مایکروسافت (که اکنون Copilot نامیده می شود)، که زیربنای آن مدل OpenAI است، اطلاعات نادرستی ارائه کرده است که گفته می شود از روزنامه تایمز آمده است – از جمله نتایج مربوط به “۱۵ غذای مفید برای قلب”. ۱۲ مورد از آنها در هیچ مقاله تایمز ذکر نشده است.
تایمز همچنین این موضوع را مطرح میکند که OpenAI و مایکروسافت به طور مؤثر با استفاده از آثار تایمز رقبای نشر خبر ایجاد میکنند و با ارائه اطلاعاتی که معمولاً بدون اشتراک نمیتوان به آن دسترسی پیدا کرد، به تجارت تایمز آسیب میرسانند. اطلاعاتی که همیشه دارای استنادات قوی نیست، چرا که گاهی اوقات این بخش از محتوا توسط همکاران فروش و یا به صورت رپورتاژهایی دارای کمیسیون منتشر میشوند.
همانطور که شکایت تایمز به آن اشاره میکند، مدلهای هوش مصنوعی مولد تمایل به بازگرداندن دادههای آموزشی دارند، برای مثال بازتولید تقریباً کلمه به کلمه نتایج از مقالهها. فراتر از بازگشت، OpenAI حداقل در یک مورد به طور سهوی کاربران ChatGPT را قادر ساخته است تا محتوای خبری دارای محدودیت پرداختی را دور بزنند.
این شکایت میگوید: «مدافعان بهدنبال این هستند که از سرمایهگذاری هنگفت تایمز در روزنامهنگاری خود استفاده کنند.
اثرگذاری منفی در کسب و کار اشتراک خبر- و ترافیک ناشران وب – موضوع اصلی یک شکایت مشابه نیز بوده است که ناشران در اوایل ماه جاری علیه Google ارائه کردند. در این پرونده، شاکیان، مانند تایمز، ادعا کردهاند، آزمایشهای GenAI گوگل، از جمله ربات چت Bard مبتنی بر هوش مصنوعی و تجربه مولد جستجو، محتوای ناشران، خوانندگان و درآمد تبلیغات ناشی از ابزارهای ضدرقابتی را حذف میکند.
ادعاهای ناشران حقیقت دارد. یک مدل اخیر از The Atlantic دریافته است که اگر موتور جستجویی مانند گوگل، هوش مصنوعی را در جستجوی خود ادغام کند، در ۷۵ درصد مواقع به درخواست کاربر به طور کامل پاسخ می دهد بدون آن که نیاز باشد کاربر بر روی لینک وبسایت کلیک کند. بدین ترتیب ناشران تخمین میزنند ۴۰٪ از ترافیک سایت خود را از دست خواهند داد.
این بدان معنا نیست که آنها در دادگاه موفق خواهند شد. هدر میکر، شریک موسس در OSS Capital و مشاور در IP matters بر اساس مجوز توافقات، مثال تایمز از بازگشت مجدد را با “استفاده از پردازشگر کلمه برای برش و چسباندن” مقایسه کرد.
میکر از طریق ایمیل به TechCrunch گفت: «نیویورک تایمز در شکایتش، نمونهای از جلسه ChatGPT درباره بررسی رستوران در سال ۲۰۱۲ را ارائه میکند. درخواست برای ChatGPT این است که “بندهای آغازین بررسی او چه بود؟” درخواست های بعدی به طور مکرر “جمله بعدی” را درخواست می کنند. اذیت کردن یک چتبات برای بازتولید ورودی، مبنای معقولی برای نقض حق نسخه برداری نیست… اگر کاربر عمداً این کار را انجام دهد. کپی کردن گفتگو در چتبات، تقصیر کاربر است. و به همین دلیل است که اکثر [دعواهای حقوقی مانند این] احتمالاً شکست خواهند خورد.»
برخی از خبرگزاری ها، به جای مبارزه با فروشندگان هوش مصنوعی مولد در دادگاه، مجوز قراردادها را با آنها امضا کرده اند. آسوشیتدپرس در ماه جولای قرارداد با OpenAI منعقد کرد و اکسل اسپرینگر، ناشر آلمانی که مالک Politico و Business Insider است نیز به همین ترتیب این ماه یک قرارداد با این شرکت امضا کرد.
تایمز در شکایت خود میگوید که تلاش کرده تا در ماه آوریل با مایکروسافت و OpenAI به توافقی برای صدور مجوز دست یابد، اما مذاکرات در نهایت مثمر ثمر نبوده است.