تفسیر زبان های نانوشته به یاری مترجم هوش مصنوعی متا
به گزارش هاست لینوکس، مترجم مبتنی بر هوش مصنوعی متا، اکنون می تواند حتی زبان های نانوشته را تفسیر و آن را به زبان های دیگر ترجمه کند.
درحال حاضر حدود 7000 زبان در دنیا شناخته شده است که بعضی از آن ها مؤلفه های نوشتاری ندارند. این نوع زبان ها که از آن ها به عنوان زبان های نانوشته یاد می گردد، مشکل منحصربه فردی برای سیستم های ترجمه یادگیری ماشینی مدرن ایجاد می نمایند؛ زیرا چنین سیستم هایی برای تبدیل یک متن از زبانی به زبان دیگر، به گفتاری احتیاج دارند که بتوان آن را به نوشتار تبدیل کرد. به هرحال گزارش شده است که متا درحال حاضر سعی دارد با هوش مصنوعی، این مشکل را برطرف کند.
متا اکنون مشغول توسعه سیستم ترجمه گفتار به گفتار لحظه ای است تا ساکنان متاورس بتوانند راحت تر با یکدیگر تعامل داشته باشند. محققان این شرکت اکنون به عنوان بخشی از این پروژه که مترجم متن گفتاری دنیای متا (UST) نام دارد، سعی دارند سیستمی برای ترجمه زبان Hokkien به انگلیسی ایجاد نمایند. این زبان نانوشته در سرتاسر دیاسپورای آسیا مورداستفاده قرار می گیرد و یکی از زبان های رسمی تایوان است. دیاسپورا به افراد مهاجری اطلاق می گردد که خارج از کشور محل تولد یا اصل و نسب خود، به صورت موقت یا دائم ساکن هستند، اما روابط عاطفی و مادی خود را با کشورهای مبدأ همچنان حفظ می نمایند.
به گزارش انگجت، آموزش اولیه سیستم های ترجمه مبتنی بر یادگیری ماشینی، معمولاً به نمونه های قابل برچسب گذاری گسترده از زبان به صورت نوشتاری یا گفتاری احتیاج دارد و این دقیقاً مؤلفه ای است که زبان های نانوشته مانند Hokkein از آن بی بهره هستند. مارک زاکربرگ، مدیرعامل متا در پستی وبلاگی شرح داد:
ما برای برطرف مشکل زبان های نانوشته، از ترجمه گفتار به واحد (S2UT) برای تبدیل گفتار به دنباله ای از واحد های صوتی که متا قبلاً در آن پیشگام بوده است، استفاده کردیم. سپس شکل موج ها را براساس واحد ها ایجاد کردیم. علاوه براین از UnitY به عنوان مکانیزم رمزگشایی استفاده شد که اولین گذر متنی را به یک زبان مرتبط (مثل ماندارین) ایجاد می نماید و رمزگشای گذر دوم نیز وظیفه ساخت واحد ها را برعهده دارد.
زاکربرگ در تکمیل شرحات خود گفت:
ما از ماندارین به عنوان یک زبان میانی برای ساختن برچسب های کاذب استفاده کردیم، جایی که ابتدا گفتار انگلیسی (یا Hokkien) را به متن ماندارین و سپس به Hokkien (یا انگلیسی) ترجمه کردیم و داده های آموزشی نیز دراین مرحله به آن اضافه شد.
درحال حاضر سیستم مترجم متن هوش مصنوعی متا به افرادی که با زبان Hokkien صحبت می نماید اجازه می دهد تا با کسی که انگلیسی حرف می زنند صحبت نمایند. این مدل می تواند به طور لحظه ای فقط یک جمله کامل را درک و آن را ترجمه کند، اما زاکربرگ اطمینان دارد که تکنیک متا درنهایت می تواند برای ترجمه زبان های دیگر نیز مورد استفاده قرار گیرد و ترجمه بلادرنگ آن نیز بهبود یابد.
بنر تسک میران
متا علاوه بر ارائه مدل ها و داده های آموزشی به عنوان پروژه های منبع باز، اولین سیستم محک گذاری ترجمه گفتار به گفتار را براساس مجموعه گفتار Hokkien در سرتاسر تایوان منتشر می نماید. زاکربرگ اعلام نموده است که ماتریس گفتار، مجموعه بزرگی از ترجمه های گفتار به گفتار است که با تکنیک داده کاوی مبتکرانه متا موسوم به لیزر استخراج شده است و به محققان اجازه می دهد تا با استفاده از آن، سیستم های ترجمه گفتار به گفتار (S2ST) خود را ایجاد نمایند.
هاست لینوکس فضای مجازی دریچه فناوری
منبع: باشگاه خبرنگاران جوان