GSI Technology מודיעה על תוצאות ביצוע ראשוניות למעבד Gemini-II
- GSI Technology פרסמה תוצאות benchmark ראשוניות למעבד ה-Compute-in-Memory Gemini-II, שמציגות זמן של 3 שניות ל-token ראשון עבור מודלי שפה גדולים מרובי-מצבים שפועלים בקצה הרשת עם קלטי וידאו וטקסט.
- לפי מנכ"ל החברה, הביצועים של Gemini-II מאפשרים הסקה מרובת-מצבים בהשהיה נמוכה ובצריכת חשמל נמוכה, מה שתומך ביישומי זמן אמת כמו מערכות אוטונומיות ומכונות חכמות מחוץ למרכזי נתונים.

חברת GSI Technology (GSIT) הודיעה על תוצאות ביצוע ראשוניות (benchmark) עבור מעבד ה-Compute-in-Memory מדגם Gemini-II. התוצאות הראו זמן של 3 שניות ל-token הראשון (time-to-first-token) עבור מודלים מרובי-מצבים (multimodal) של מודלים שפתיים גדולים (LLM) שפועלים בקצה הרשת (edge) עם קלטי וידאו וטקסט. “תוצאות ה-benchmark האלה מדגישות מה שטכנולוגיית compute-in-memory יכולה לאפשר עבור בינה מלאכותית פיזית,” אמר לי-לין שו, נשיא ומנכ"ל GSI Technology. “פריסות בקצה הרשת דורשות תגובה מהירה תחת מגבלות מחמירות של צריכת חשמל וטמפרטורה. זמן TTFT של 3 שניות אומר שהמערכת יכולה להפיק תגובה ראשונית כל שלוש שניות. זה בדרך כלל מספיק מהיר כדי להיות שימושי ביישומים מבוססי וידאו, בלי לפספס אירועים משמעותיים. היכולת של Gemini-II לספק הסקה מרובת-מצבים (multimodal inference) בהשהיה נמוכה ובצריכת חשמל נמוכה תומכת במגוון רחב יותר של יישומים בזמן אמת, ממערכות אוטונומיות ועד מכונות חכמות שפועלות מחוץ למרכז הנתונים.”
פורסם לראשונה ב-TheFly – מקור מידע סופי לידיעות פיננסיות חדשות בזמן אמת שמניעות את השוק. נסו עכשיו>>
קראו עוד על GSIT: