Perplexity ، یک استارتاپ مستقر در سان فرانسیسکو ، دو مدل زبان بزرگ (LLM) جدید آنلاین به نام pplx-7b-online و pplx-70b-online معرفی کرده است.
این مدل های LLM آنلاین به هدف برطرف کردن محدودیت های اساسی بسیاری از مدل های LLM موجود میباشند: قادر نبودن به ارائه اطلاعات بهروز و تمایل به تولید اطلاعات نادرست است.
مفهوم چیست؟
در صورت تکمیلش، مدل های آنلاین LLM شرکت Perplexity میتوانند به اطلاعات جدیدتر از اینترنت دسترسی پیدا کرده و پاسخها را تولید کنند که اتکای آنها بر رویدادها یا دادههای اخیری دارد. برای مثال، این مدل ها قادرند آخرین امتیازات ورزشی، قیمت های سهام یا جدیدترین اخبار گوگل را گزارش کنند. این تمایز واقعی نسبت به مدل های آفلاین مثل GPT-3.5 است که به تنهایی به دادههای آموزشی خود اتکا میکند و به تدریج منسوخ میشود.
چگونه مدل های PPLX با GPT 3.5 مقایسه میشوند؟
آزمایشات اولیه ارایه شده از سوی شرکت نشان میدهد که مدل های LLM آنلاین Perplexity با یا بیشتر از تواناییهای مدلهای LLM سازمانی پرچمدار مانند GPT-3.5 در اندازهگیری های مقاومت، کمکرسانی و دانش در حوزه های دانشی همخوانی دارند.
چگونه مدل های آنلاین LLM از چالشهای دقت پیروی میکنند؟
یک مقاله با عنوان “FRESHLLMS: تازهکردن مدل های زبان بزرگ با تحکم تقویت جستجوی موتور” (در دست بررسی) محدودیتهای اساسی در LLM های سنتی را برجسته کرد.
این مقاله به خصوص بر روی تلاش برای LLM ها برای حفظ پا به دنبال دانش جهانی در حال تحول و تمایل آنها به تولید پاسخهای حقیقتگرا متمایل به تداعی، تمرکز داشت.
چگونه به مدل های آنلاین LLM پر سرعت Perplexity دسترسی پیدا کنیم؟
این مدلها از طریق رابط برنامه نویسی اپلیکیشن (API) و رابط وب لابراتوارهای Perplexity در دسترس عمومی است، که توسعه دهندگان امکان ادغام فناوری به کاربردها و وبسایتهای خود را فراهم میکند.