OpenAI קיבלה תפנית בלתי צפויה בנוף הבינה המלאכותית עם השיגור de GPT-OSS, מודל שפת הקוד הפתוח הראשון שלה מזה למעלה מחמש שנים. התפתחות זו מסמנת סטייה מהאסטרטגיה האחרונה של החברה, אשר הסתמכה בעיקר על מודלים קנייניים ושירותים סגורים. עם הגעת GPT-OSS, OpenAI חוזרת לשורשים שלה, ופותחת את הדלת לכל אחד או ישות לגשת, להפעיל ולהתאים אישית מודל שפה רב עוצמה מבלי להסתמך על פלטפורמת הענן שלה או חיבורי האינטרנט.
הדגם החדש זמין בשתי גרסאות: אחת עם 120.000 מיליארד פרמטרים וגרסה קלה יותר עם 20.000 מיליארד פרמטרים.הגרסה החזקה ביותר יכולה לפעול על כרטיס מסך מקצועי יחיד עם לפחות 80 ג'יגה-בייט של זיכרון, בעוד שהגרסה הקטנה יותר מיועדת למחשבים אישיים וניידים מיינסטרים עם 16 ג'יגה-בייט של זיכרון RAM, אשר... דמוקרטיזציה משמעותית של הגישה ליכולות בינה מלאכותית מתקדמותניתן להוריד את שתי הגרסאות בחינם מפלטפורמות כמו Hugging Face ולפרוס אותן בשירותים פופולריים כמו Azure או AWS.
מאפיינים טכניים וטכנולוגיה בשימוש
עם GPT-OSS, OpenAI הציבה על השולחן שני מודלים שעוצבו עם ארכיטקטורה המבוססת על שנאי ותערובת מומחים (MoE). זה מאפשר אופטימיזציה של ניצול הזיכרון והשהייה על ידי הפעלת חלק נבחר בלבד של מומחים לכל אסימון קלט, הגדלת היעילות מבלי להתפשר על צריכת החשמל. גרסת ה-120B משתמשת ב-36 בלוקים ומפעילה 5.100 מיליארד פרמטרים לכל אסימון, בעוד שגרסת ה-20B משתמשת ב-24 בלוקים ומפעילה 3.600 מיליארד, מה שמקל על ההפעלה על חומרה במחיר סביר יותר.
שני המודלים אומנו בעיקר על נתונים באנגלית מאזורים STEM, תכנות וידע כללי, כולל שלב נוסף של הסתגלות וחיזוק בפיקוח כדי לשפר את התאמה להוראות אנושיותבין יכולותיה נמצאות ה- שרשרת מחשבה, היכולת לנתח שלבים ביניים לפני מתן תגובה, כמו גם היכולת להשתמש בכלים חיצוניים כגון גלישה באינטרנט או ביצוע קוד Python.
אפשרויות זמינות, רישוי ואינטגרציה
אחת האטרקציות הגדולות של GPT-OSS היא רישיון אפאצ'י 2.0, אשר מבטל רבות מהמגבלות הרגילות של מודלים סגורים אחרים: זה מאפשר לה שימוש מסחרי, הפצה מחדש ואינטגרציה בכל סוגי הפרויקטים, החל מסטארט-אפים קטנים ועד גופים ציבוריים גדולים או יוזמות מו"פ. משקלי המודל זמינים בפורמט MXFP4 ויש להם יישומים ייחוסיים ב-PyTorch ו-Apple Metal, כמו גם תאימות מלאה עם כלים כגון אולמה, llama.cpp, LM Studio ו-vLLM, מה שמקל על השימוש בו הן בסביבות מקצועיות והן בסביבות ביתיות.
ההתקנה וההפעלה של GPT-OSS-20B פשוטות במיוחד הודות לכלי עזר כמו LM Studio, המאפשרים לך משתמשים ללא ניסיון בתכנות הורד ובדוק את המודל באופן מקומי באמצעות ממשק גרפי. בנוסף, OpenAI פרסמה תיעוד מפורט והמלצות לכוונון עדין והתאמת מודלים, כמו גם אינטגרציות מוכנות עבור פלטפורמות ענן ופלטפורמות מקומיות.
בטיחות, בדיקות וגישה אחראית
השקת GPT-OSS לא התמקדה רק בפתיחות, אלא גם ב בטיחות ושימוש אחראי של המודלים. OpenAI שילבה מנגנוני סקירה ואימות חדשים כדי למנוע סיכונים הקשורים לשימוש לרעה, במיוחד בתחומים רגישים כמו אבטחת סייבר או יצירת סוכנים זדוניים. לשם כך, היא יישמה מתודולוגיית בדיקה עוינת (red teaming), עם סקירות חיצוניות על ידי מומחים עצמאיים ופרוטוקולים כדי לדמות תרחישי ניצול קיצוניים.
יחד עם פרסום המודלים, OpenAI השיקה אתגר צוות אדום עם תגמולים כספיים עבור אלו המזהים פגיעויות או התנהגויות בעייתיות, ובכך מחפשים שיתוף פעולה פעיל של הקהילה הגלובלית בזיהוי סיכונים. בנוסף, GPT-OSS חושף את שרשרת ההיגיון, מקלה על ביקורת וניטור תגובות כדי למנוע הטיות או שגיאות עדינות.
ביצועים והשוואה עם דגמים פתוחים אחרים
ב מדדים אקדמיים ומבחני חשיבה, ה-GPT-OSS-120B דומה לדגמים קנייניים עדכניים של OpenAI כמו o4-mini, ואף עולה עליו בכמה היבטים, ובמקביל עולה על אחרים כמו DeepSeek R1 או סדרת Llama. גרסת ה-20B, המותאמת למכשירים ביתיים, שומרת על... קשר מצוין בין יעילות לקיבולת, עם ציונים תחרותיים מאוד במתמטיקה, קידוד ובריאות.
OpenAI מזהירה כי מודלים פתוחים אלה עשויים להציג נטייה גדולה יותר ל"הזיות" (טעויות עובדתיות) בהשוואה למקבילותיהם בענן, בהתחשב בהבדלים באימון ובניטור. עם זאת, למשתמשים יש כעת את היכולת להשתמש במודלים ברמה גבוהה ללא צורך בשירותים מקוונים.