בימ"ש הורה למסור את מאגר המידע שאימן את GPT4

אולי יעניין אותך גם

שופט פדרלי בקליפורניה הורה ל-OpenAI למסור את בסיס הנתונים ששימש לאימון מודל GPT-4 במסגרת תביעה על הפרת זכויות יוצרים שהגישו נגדה כמה סופרים ובהם הקומיקאית שרה סילברמן. בתביעה, המבקשת הכרה כייצוגית, טוענים הסופרים ש- OpenAI השתמשה ביצירותיהם ללא רשות או פיצוי.

בין התובעים נמנים פרט לסילברמן, גם סופר האימה פול ג'י טרמבלי ועוד.  OpenAI טענה כי מדובר בשימוש הוגן, אך השופט רוברט מ. אילמן, במסגרת שימוע בעל-פה שקיים, הורה בכל זאת על מסירת המאגר.

הסופרים ביקשו גישה לבסיס נתונים בשם  "English Colang" ששימש לאימון GPT-4, לאחר ש-OpenAI  סיפקה במסגרת הליכי הגילוי בתיק מאגרים אחרים, כולל כאלה המכילים עותקים פיראטיים של יצירותיהם.  הנתבעת הסכימה לספק רק חלק קטן מהמאגר, כשהיא נסמכת על שיקולי אבטחה. השופט הורה לצדדים להסכים על פרוטוקולי אבטחה לפני מסירת המאגר.

בנוסף, בית המשפט נענה לבקשת OpenAI  למנוע מסירת מידע על גודל המאגר ומפרטיו הטכניים, בטענה שמדובר במידע סודי. מקור: Law360 (סגור בתשלום למנויים).