چهارشنبه 23 آبان 1397
ترجمه آنلاین میهن دیک، خدمات ترجمه تخصصی | MihanDic


مدلی برای ترجمه سریع و کارآمد بیشتر زبان ها

مدلی برای ترجمه سریع و کارآمد بیشتر زبان ها

محققان MIT یک مدل ترجمه " بدون نظارت" جدیدی را به وجود آورده اند که  قادر است بدون نیاز به راهنمایی های انسانی اجرا شود و می تواند به ترجمه سریع تر و کارآمد تر زبان های بسیار بیشتری منجرگردد.

سیستم های ترجمه گوگل، فیس بوک و آمازون نیاز به مدل های آموزشی برای جستجوی الگوها در میلیون ها اسناد مانند اسناد قانونی و سیاسی و یا مقالات اخبار دارند که توسط انسان ها به زبان های مختلف ترجمه شده اند. با توجه به کلمات جدید در یک زبان، آنها می توانند کلمات و عبارات مشابه را در زبان دیگر پیدا کنند.

اما این داده های ترجمه شده برای جمع آوری، زمان گیر و دشوار هستند و ممکن است برای بسیاری از 7000 زبان در سراسر جهان وجود نداشته باشند. به تازگی، محققان در حال توسعه مدل های یکطرفه هستند که متون را به دو زبان اما بدون اطلاعات مستقیم بین این دو ترجمه می کنند.

 محققان علوم کامپیوتر و آزمایشگاه هوش مصنوعی (CSAIL) در مقاله ای که این هفته در کنفرانس روش های تجربی در پردازش زبان طبیعی ارائه شده است، مدل هایی را ارائه می دهند که سریع تر و کارآمد تر از مدل های تک لاین می باشند.

این مدل متریک در آمار، به نام فاصله Gromov-Wasserstein است، که اساسا فاصله های بین نقاط در یک فضای محاسباتی را اندازه گیری می کند و آنها را با نقاط مشابه به فاصله ای دیگر در فضای دیگر می برد. آنها این تکنیک را برای "تعبیر کلمه" دو زبان اعمال می کنند تا کلمات را به عنوان بردارها نشان دهند. اساسا، آرایه های اعداد با کلمات دارای معانی مشابه هستند و با یکدیگر همخوانی دارند. در انجام این کار، مدل به سرعت کلمات یا بردارها را در هر دو مؤلفه که بیشتر با فاصله های نسبی ارتباط دارند، به طرز چشمگیری هدایت می کند، به این معنی که آنها احتمالا ترجمه مستقیم هستند.

در آزمایشات، مدل محققان به گونه ای دقیق به عنوان مدل های تک لایی پیشرفته و گاهی دقیق تر عمل می کرد، اما خیلی سریع تر و با استفاده از تنها یک درصد از قدرت محاسبات بود.

محقق CSAIL و پروفسور توماس می گویند: "مدل، کلمات را در دو زبان به عنوان مجموعه بردارها می بیند و نقشه ها [آن بردارها] را از یک سو به سوی دیگر حفظ می کند. در بخش مهندسی برق و علوم کامپیوتر و موسسه داده ها، سیستم ها و جامعه "این رویکرد می تواند به زبان های کم منابع و یا گویش ها کمک کند، تا زمانی که با محتوای یک طرفه به اندازه کافی عرضه شوند."

دیوید آلوارز ملیس، دانشجوی دکترا CSAIL، می گوید: "اگر شما هیچ داده ای ندارید که با دو زبان متفاوت باشد، این نشان دهنده یک گام به سمت یکی از اهداف اصلی ترجمه ماشین بوده که به طور کامل کنترل نشده است.  شمامی توانید دو زبان را با نقشه و با استفاده از این اندازه گیری های فاصله،  همتراز کنید. "

مدلی برای ترجمه سریع و کارآمد بیشتر زبان ها
مدلی برای ترجمه سریع و کارآمد بیشتر زبان ها
ارسال شده در تاریخ 1397/08/10


گفتگوی آنلاین