LLM (مدلِ زبانیِ بزرگ) مثلِ ChatGPT چطور آموزش دیده و با هوش مصنوعیِ تشخیصیِ رادیوگرافی چه فرقی دارد؟

هوش مصنوعیِ تشخیصی با هزاران رادیوگرافیِ برچسبخورده توسط متخصص آموزش دیده و هدفش نزدیکشدن به یک حقیقتِ بیرونی (وجود یا عدم پوسیدگی) است؛ LLM اما با حجمِ عظیمی از متن آموزش دیده و در طولِ آموزش فقط یک کار انجام داده: حدسِ کلمهی بعدی. هدفِ آن از اساس «محتملبودن»، نه «درستبودن»، است.

چرا LLM با وجودِ اینکه دنبالِ درستی نیست، اغلب جوابِ درست میدهد؟

چون چیزی که درست است معمولاً در متنهایی که مدل از آنها یاد گرفته زیاد تکرار شده و در نتیجه «محتمل» هم هست؛ برای همین در بیشترِ موارد جوابِ محتمل و جوابِ درست یکی از آب درمیآیند. اما این همپوشانی یک تضمین نیست، فقط یک خوشاقبالی است.

وقتی «محتمل» و «درست» از هم جدا میشوند، LLM طرفِ کدامیک را میگیرد؟

مدل بیدرنگ طرفِ «محتمل» را میگیرد، چون از اساس برای همین ساخته شده و درستی هیچوقت هدفش نبوده؛ به همین دلیل نمیشود با LLM مثلِ یک ابزارِ تشخیصیِ متکی بر پاسخِ درست رفتار کرد.

← بازگشت به پرامپتولوژیست

فصل ۱ · قسمت ۲

دو نژادِ متفاوت، دو منطقِ متفاوت

⏱ ۴ دقیقه مطالعه

متنِ این قسمت

در قسمتِ قبل گفتیم آن چیزی که با آن گپ می‌زنید و آن چیزی که روی رادیوگرافی ضایعه را تشخیص می‌دهد، از دو نسلِ متفاوت‌اند و با دو منطقِ متفاوت به جواب می‌رسند. حالا برویم سراغِ اینکه این دو منطق دقیقاً چه‌اند، چون تمامِ چیزی که در ادامه‌ی این کتاب می‌آید، از همین تفاوت ریشه می‌گیرد.

اول اسمِ درست را بگذاریم. آن چیزی که با آن گپ می‌زنید، یعنی ChatGPT یا جمینای گوگل یا کلود، یک نوع هوش مصنوعی است که به آن می‌گویند ، یا به اختصار LLM (عبارتِ اختصاریِ Large Language Model). از این به بعد هر جا گفتیم «مدل» یا «LLM»، منظورمان همین خانواده است؛ همان چیزی که می‌شناسید، فقط با اسمِ فنی‌اش.

حالا تفاوت. آن نرم‌افزارِ تشخیصی را تصور کنید که قرار است روی رادیوگرافی پوسیدگی را پیدا کند. چطور ساخته شده؟ به آن هزاران، گاهی صدها هزار رادیوگرافی نشان داده‌اند که متخصص‌ها رویشان مشخص کرده‌اند کجا پوسیدگی هست و کجا نیست. مدل بارها و بارها حدس زده، و هر بار حدسش با آن جوابِ درستِ متخصص مقایسه شده: درست گفتی یا غلط؟ این چرخه آن‌قدر تکرار شده تا مدل در تشخیص دقیق شود.

نکته‌ی کلیدی این است: یک پاسخِ درست وجود دارد، بیرون از مدل. پوسیدگی یا واقعاً آنجا هست یا نیست، و این را واقعیتِ دندانِ بیمار تعیین می‌کند، نه مدل. کلِّ آموزشِ این سیستم یعنی نزدیک‌شدن به آن حقیقتِ بیرونی.

حالا LLM. این یکی اصلاً این‌طور آموزش ندیده. به آن حجمِ عظیمی از متن داده‌اند، از کتاب و مقاله تا صفحه‌ی وب و گفت‌وگو، و کارش در طولِ آموزش فقط یک چیز بوده: حدس‌زدنِ کلمه‌ی بعدی. جمله‌ای را نیمه‌کاره جلویش گذاشته‌اند و او باید حدس بزند کلمه‌ی بعد چه باید باشد. میلیاردها بار. «آسمان آبی ___» و او یاد می‌گیرد که «است» محتمل‌تر از «نیست» است. همین، در مقیاسی نجومی.

و این تفاوت، یک تفاوتِ ساده‌ی فنی نیست. دو هدفِ کاملاً متفاوت است. آن نرم‌افزارِ تشخیصی تمامِ عمرش را صرفِ یک پرسش کرده: چه چیزی درست است؟ مدلِ زبانی تمامِ عمرش را صرفِ پرسشی دیگر کرده: چه چیزی محتمل است که بعد بیاید؟

دقت کنید که این دو، اغلب به یک جواب می‌رسند، و همین است که مدلِ زبانی را تا این حد کارآمد می‌کند. چون چیزی که درست است، معمولاً در متن‌هایی که مدل از آنها یاد گرفته زیاد تکرار شده، و در نتیجه «محتمل» هم هست. وقتی می‌پرسید پایتختِ فرانسه کجاست، جوابِ درست و جوابِ محتمل یکی است، چون «پاریس» هزاران بار کنارِ این سوال آمده. برای همین مدل بیشترِ وقت‌ها جوابِ درستی می‌دهد.

ولی این هم‌پوشانی یک تضمین نیست، یک خوش‌اقبالی است. جایی که «محتمل» و «درست» از هم جدا می‌شوند، و جدا می‌شوند، مدل بی‌درنگ طرفِ «محتمل» را می‌گیرد. چون از اساس برای همان ساخته شده. درستی هیچ‌وقت هدفش نبوده.

برای همین نمی‌شود با LLM مثلِ آن نرم‌افزارِ تشخیصی رفتار کرد. آن یکی ابزاری است که برای رسیدن به یک پاسخِ درست تنظیم شده. این یکی ابزاری است که برای تولیدِ متنی باورپذیر تنظیم شده، و باورپذیر بودن با درست بودن یکی نیست.

و دقیقاً همین‌جا یک سوال پیش می‌آید: اگر مدل دنبالِ درستی نیست و فقط دنبالِ محتمل‌بودن است، پس وقتی چیزی نمی‌داند چه می‌کند؟ سکوت که نمی‌کند. جوابِ این سوال، ما را می‌برد به سراغِ یکی از مهم‌ترین چیزهایی که یک دندانپزشک باید درباره‌ی این ابزار بداند، یعنی موضوعِ قسمتِ بعد.

کلیدواژه‌ها

مدل زبانی بزرگ (LLM) هوش مصنوعی تشخیصی هوش مصنوعی مولد آموزش مدل هوش مصنوعی حدس کلمه‌ی بعدی محتمل در برابر درست ChatGPT جمینای کلود داده‌ی آموزشی منطق تصمیم‌گیری ماشین تشخیص پوسیدگی

برچسب‌ها

#هوش_مصنوعی#ChatGPT#LLM#مدل_زبانی#هوش_مصنوعی_دندانپزشکی#DentalAI#DiagnosticAI#GenerativeAI#هوش_مصنوعی_تشخیصی#هوش_مصنوعی_مولد#تشخیص_پوسیدگی#AILiteracy#سواد_هوش_مصنوعی#پرامپتولوژیست

محتوای مرتبط

← قسمت قبلی قسمت بعدی →

دو نژادِ متفاوت، دو منطقِ متفاوت

متنِ این قسمت

کلیدواژه‌ها

برچسب‌ها

محتوای مرتبط

کاوش بیشتر

جستجوی سراسری دنت‌کست