Movatterモバイル変換


[0]ホーム

URL:


KR20170055630A - Multilingual translation method - Google Patents

Multilingual translation method
Download PDF

Info

Publication number
KR20170055630A
KR20170055630AKR1020150158521AKR20150158521AKR20170055630AKR 20170055630 AKR20170055630 AKR 20170055630AKR 1020150158521 AKR1020150158521 AKR 1020150158521AKR 20150158521 AKR20150158521 AKR 20150158521AKR 20170055630 AKR20170055630 AKR 20170055630A
Authority
KR
South Korea
Prior art keywords
language
translation
language message
user terminal
providing server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020150158521A
Other languages
Korean (ko)
Other versions
KR101740671B1 (en
Inventor
이현옥
Original Assignee
이현옥
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이현옥filedCritical이현옥
Priority to KR1020150158521ApriorityCriticalpatent/KR101740671B1/en
Priority to PCT/KR2015/012569prioritypatent/WO2017082445A1/en
Publication of KR20170055630ApublicationCriticalpatent/KR20170055630A/en
Application grantedgrantedCritical
Publication of KR101740671B1publicationCriticalpatent/KR101740671B1/en
Expired - Fee Relatedlegal-statusCriticalCurrent
Anticipated expirationlegal-statusCritical

Links

Images

Classifications

Landscapes

Abstract

Translated fromKorean

본 발명은 상용화에 근접한 수준의 신뢰성 있는 번역 서비스를 제공할 수 있도록 하는 다국어 번역 방법에 관한 것으로서, 사용자단말기가 사용자로부터 제1언어 메시지를 입력받아 서비스제공서버로 전송하는 단계(S100); 상기 서비스제공서버가 통계적 기계번역에 기반하여 상기 제1언어를 제외한 언어 중 상기 제2언어와의 상호 자동번역된 비중에 기초하여 1차 자동번역을 위한 제3언어를 선정하는 단계(S300); - 여기서, "통계적 기계번역에 기반"한다는 것은 인터넷상에서 컴퓨터가 참고 가능한 모든 번역문서(빅데이터)의 통계정보를 활용한다는 것임. - 상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제1언어 메시지를 제3언어 메시지로 1차 자동번역하는 단계(S500); 상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제3언어 메시지를 상기 제2언어 메시지로 2차 자동번역하는 단계(S700); 및 상기 서비스제공서버가 상기 번역된 제2언어 메시지를 상기 사용자단말기 및/또는 타 사용자단말기로 전송하는 단계(S900);를 포함하는 것을 기술적 요지로 한다.The present invention relates to a multilingual translation method capable of providing a reliable translation service at a level close to commercialization, in which a user terminal receives a first language message from a user and transmits the first language message to a service providing server (S100). A step S300 of selecting a third language for the first automatic translation on the basis of the automatically translated weight of the second language among the languages other than the first language based on statistical machine translation by the service providing server; - Here, "based on statistical machine translation" means that the statistical information of all translation documents (big data) available for computers on the Internet is utilized. - the service providing server first automatically translates the first language message into a third language message through a predetermined machine translation (S500); (S700) a second automatic translation of the third language message into the second language message through a machine translation of a predetermined method by the service providing server; And transmitting the translated second language message to the user terminal and / or another user terminal (S900).

Description

Translated fromKorean
다국어 번역 방법{Multilingual translation method}{Multilingual translation method}

본 발명은 다국어 번역 방법에 관한 것으로서, 더욱 상세하게는 상용화에 근접한 수준의 신뢰성 있는 번역 서비스를 제공할 수 있도록 하는 다국어 번역 방법에 관한 것이다.The present invention relates to a multilingual translation method, and more particularly, to a multilingual translation method capable of providing a reliable translation service at a level close to commercialization.

컴퓨터가 발전함에 따라 기계를 통해 언어의 장벽을 해소하고자 하는 연구가 오랜 시간 동안 진행되어 왔으며, 현재도 그 핵심 기술에 대한 꾸준한 연구가 이루어지고 있다.As computers have developed, research has been conducted for a long time to solve the language barriers through the machine, and steady research on the core technology is still being carried out.

21세기에 이르러 인터넷 활성화와 더욱 가속화되는 세계화는 폭발적인 다국어 콘텐츠를 생산해 내고 있으며, 그 번역의 수요는 사람의 수동 번역 생산성을 넘어선지 오래이다. 현대 사회에서 인터넷 콘텐츠의 자동번역, 고급문서번역 지원 도구 등 매우 다양한 분야에서 자동번역 기술은 중대한 핵심 요소 기술로 인식되어 가고 있다.By the 21st century, the globalization of the Internet and the accelerating globalization have produced explosive multilingual content, and the demand for translation has been beyond the manual translation productivity of people. In modern society, automatic translation technology is recognized as a key element technology in a wide variety of fields such as automatic translation of Internet contents and advanced document translation support tools.

한편, 자동번역을 위한 종래기술로서 소프트웨어를 이용한 기계 번역 방식이 다양하게 제안된 바 있으며, 직접번역방식, 문법변환방식, 중간언어방식, 예제기반방식, 통계기반방식 등 다양한 형태의 알고리즘이 개발된 바 있다.As a conventional technique for automatic translation, various machine translation methods using software have been proposed. Various types of algorithms such as a direct translation method, a grammar conversion method, an intermediate language method, an example-based method, and a statistics-based method have been developed There is a bar.

그러나, 종래기술의 경우 자동번역의 가장 기초가 되는 사전 어휘라든지 변환을 위한 규칙 또는 패턴 등은 언어의 특성으로 인해 완벽한 구축이 어려웠다. 이러한 이유로 인해 사전 미등록어 문제, 분석 규칙의 커버리지를 벗어나는 문제, 변환 정보가 존재하지 않는 문제와 같은 심각한 오류들을 발생시켰으며, 실제 그 번역 품질도 상용화에 근접한 수준에는 크게 미치지 못한 실정이다. 이러한 문제는 결국 다국어 채팅이나 펜팔과 같은 번역 시스템의 상용화에 커다란 걸림돌로 작용하여 보다 신뢰성 있는 번역 서비스를 구현하지 못하게 되는 문제점이 있다.However, in the case of the prior art, the dictionary vocabulary which is the basis of the automatic translation, the rule or the pattern for conversion, etc. are difficult to be completely constructed due to the characteristics of the language. For this reason, serious errors such as pre - unregistered word problems, out of coverage of analysis rules, and no conversion information have occurred, and the quality of translation has not reached the level close to commercialization. Such a problem is a major obstacle to the commercialization of a translation system such as a multilingual chat or a pen pal, thereby failing to implement a more reliable translation service.

KRKR10-2011-011679010-2011-0116790AAKRKR10-2012-004810410-2012-0048104AAKRKR10-045322710-0453227B1B1KRKR10-079220410-0792204B1B1KRKR10-061731910-0617319B1B1

앞선 배경기술에서 도출된 문제점을 해결하기 위한 본 발명의 목적은, 다국어 번역 서비스를 제공함에 있어 번역 품질을 현저히 향상시켜 상용화에 근접한 수준의 신뢰성 있는 번역 서비스를 구현할 수 있도록 하는 다국어 번역 방법을 제공하는 것이다.It is an object of the present invention to solve the problems derived from the prior art, and to provide a multilingual translation method for providing a multilingual translation service, in which translation quality is significantly improved and a reliable translation service close to commercialization can be implemented will be.

한편, 본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.Meanwhile, the object of the present invention is not limited to the above-mentioned objects, and other objects not mentioned can be clearly understood from the following description.

상기한 목적은, 본 발명의 실시예에 따라, 제1언어를 제2언어로 번역하기 위한 다국어 번역 방법으로서, 사용자단말기가 사용자로부터 제1언어 메시지를 입력받아 서비스제공서버로 전송하는 단계(S100); 상기 서비스제공서버가 통계적 기계번역에 기반하여 상기 제1언어를 제외한 언어 중 상기 제2언어와의 상호 자동번역된 비중에 기초하여 1차 자동번역을 위한 제3언어를 선정하는 단계(S300); - 여기서, "통계적 기계번역에 기반"한다는 것은 인터넷상에서 컴퓨터가 참고 가능한 모든 번역문서(빅데이터)의 통계정보를 활용한다는 것임. - 상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제1언어 메시지를 제3언어 메시지로 1차 자동번역하는 단계(S500); 상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제3언어 메시지를 상기 제2언어 메시지로 2차 자동번역하는 단계(S700); 및 상기 서비스제공서버가 상기 번역된 제2언어 메시지를 상기 사용자단말기 및/또는 타 사용자단말기로 전송하는 단계(S900);를 포함하는 것을 특징으로 한다.The above object is achieved according to an embodiment of the present invention, which is a multilingual translation method for translating a first language into a second language, wherein the user terminal receives a first language message from a user and transmits the first language message to a service providing server (S100 ); A step S300 of selecting a third language for the first automatic translation on the basis of the automatically translated weight of the second language among the languages other than the first language based on statistical machine translation by the service providing server; - Here, "based on statistical machine translation" means that the statistical information of all translation documents (big data) available for computers on the Internet is utilized. - the service providing server first automatically translates the first language message into a third language message through a predetermined machine translation (S500); (S700) a second automatic translation of the third language message into the second language message through a machine translation of a predetermined method by the service providing server; And transmitting the translated second language message to the user terminal and / or another user terminal (S900).

바람직하게는, 상기 (S100)에서 제1언어 메시지는 사용자 음성으로 입력되되, 상기 사용자 음성은 호흡, 발성, 발음 및 공명 조건에 따라 식별 가능하도록 상기 사용자단말기에 기등록되며, 상기 사용자단말기는 기등록된 식별 가능한 사용자 음성만을 인식하여 제1언어 메시지로 입력받는 것을 특징으로 한다.Preferably, the first language message is input as a user voice in the step (S100), and the user voice is previously registered in the user terminal so that it can be identified according to respiration, utterance, pronunciation and resonance condition, Recognizes only the registered identifiable user voice, and receives the voice as the first language message.

바람직하게는, 상기 (S100)에서 상기 사용자단말기에 입력되는 제1언어 메시지는 기지정된 맞춤법 알고리즘에 의해 교정되는 것을 특징으로 한다.Preferably, the first language message input to the user terminal in step (S100) is corrected by a pre-designated spelling algorithm.

바람직하게는, 상기 서비스제공서버가 상기 2차 자동번역된 제2언어 메시지를 통계적 기계번역을 기반으로 하는 기설정된 가중치 정보에 따라 적어도 하나의 형태소를 교정하는 단계(S800);를 더 포함하는 것을 특징으로 한다.Preferably, the service providing server further includes a step (S800) of calibrating at least one morpheme in accordance with predetermined weight information based on the statistical machine translation of the second automatically translated second language message .

바람직하게는, 상기 (S800)에서는, 상기 서비스제공서버가 상기 형태소에 대한 추천 번역어를 상기 가중치 정보에 기초해 적어도 둘 이상 추출하여 상기 사용자단말기로 전송하며, 상기 사용자단말기는 사용자로부터 추천 번역어 중 하나를 선택 입력받아 상기 형태소를 수동번역하여 교정하는 것을 특징으로 한다.Preferably, the service providing server extracts at least two recommended translations for the morpheme based on the weight information, and transmits the extracted translations to the user terminal in step S800. And the morpheme is manually translated and corrected.

바람직하게는, 상기 가중치 정보는 상기 형태소가 상기 제1언어 메시지에서 상기 제2언어 메시지로 번역되는 과정에서 수동번역된 횟수에 따라 수치화된 정보이며, 상기 추천 번역어는 상기 수치화된 가중치 정보에 따라 내림차순으로 정렬되는 특징으로 한다.Preferably, the weight information is information digitized according to the number of manual translations in the process of translating the morpheme into the second language message from the first language message, and the recommendation translation is performed in descending order according to the quantized weight information As shown in FIG.

바람직하게는, 상기 형태소에 대한 가중치 정보가 일정 통계수치 미만이면 상기 형태소를 교정하지 않는 것을 특징으로 한다.Preferably, the morpheme is not corrected if the weight information for the morpheme is less than a certain statistical value.

상기한 실시예에 따른 본 발명에 의하면, 다단계의 교차 번역과 함께 가중치를 적용시킴으로써 번역 품질을 현저히 향상시키고 상용화에 근접한 수준의 신뢰성 있는 번역 서비스를 구현할 수 있는 효과가 있다.According to the present invention, it is possible to implement a multilevel cross-translation and a weighted value, thereby significantly improving translation quality and realizing a reliable translation service at a level close to commercialization.

도1은 본 발명의 실시예에 따른 다국어 번역 방법에 대한 시스템 구성도를 나타내는 개념도이고,
도2는 본 발명의 실시예에 따른 다국어 번역 방법을 설명하기 위한 흐름도이고,
도3은 본 발명의 실시예에서 더 부가될 수 있는 일례를 설명하기 위한 흐름도이다.
1 is a conceptual diagram showing a system configuration diagram of a multilingual translation method according to an embodiment of the present invention,
2 is a flowchart for explaining a multilingual translation method according to an embodiment of the present invention,
3 is a flow chart for explaining an example which can be further added in the embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 그리고 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것이 아니다. 본 명세서에서 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention and the manner of achieving them will become apparent with reference to the embodiments described in detail below with reference to the accompanying drawings. However, the present invention is not limited to the embodiments described below, but may be embodied in various different forms, and these embodiments are not intended to be exhaustive or to limit the scope of the present invention to the precise form disclosed, It is provided to inform the person completely of the scope of the invention. And the terminology used herein is for the purpose of illustrating embodiments and is not intended to be limiting of the present invention. The singular forms herein include plural forms unless the context clearly dictates otherwise.

이하, 첨부된 도면들을 참조하면서 본 발명의 바람직한 실시예에 대해 상세히 설명하기로 한다. 한편, 해당 기술분야의 통상적인 지식을 가진자로부터 용이하게 알 수 있는 구성과 그에 대한 작용 및 효과에 대한 도시 및 상세한 설명은 간략히 하거나 생략하고 본 발명과 관련된 부분들을 중심으로 상세히 설명하도록 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Brief Description of Drawings FIG. 1 is a block diagram of a computer system according to an embodiment of the present invention; FIG. 2 is a block diagram of a computer system according to an embodiment of the present invention; FIG.

본 발명의 실시예에 따른 다국어 번역 방법은, 도1과 같은 시스템 구성에 통해 제1언어를 제2언어로 번역하기 위한 방법으로서, 웹번역이나 문서번역은 물론 다국어 채팅이나 펜팔 서비스에 활용될 수 있다.The multilingual translation method according to an embodiment of the present invention is a method for translating a first language into a second language through the system configuration as shown in FIG. 1, and can be used for multilingual chat or pen pal services as well as web translation and document translation have.

이러한 본 발명은, 도2를 참조할 수 있는 바와 같이, 제1언어 메시지를 입력하는 단계(S100)와, 제1언어 메시지의 교차 번역을 위한 제3언어를 선정하는 단계(S300)와, 제1언어 메시지를 제3언어 메시지로 1차 번역하는 단계(S500)와, 1차 번역된 제3언어 메시지를 다시 제2언어 메시지로 2차 번역하는 단계(S700), 2차 번역된 제2언어 메시지를 사용자단말기로 전송하는 단계(S900)를 포함한다.As shown in FIG. 2, the present invention includes a step S100 of inputting a first language message, a step S300 of selecting a third language for cross-translation of the first language message, (S500) of translating the first language message into a third language message, a step (S700) of translating the first language message to the second language message again (S700), a second language translation And transmitting the message to the user terminal (S900).

먼저, 상기 (S100)에서는 사용자단말기가 사용자로부터 제1언어 메시지를 입력받아 서비스제공서버로 전송한다.In step S100, the user terminal receives the first language message from the user and transmits the first language message to the service providing server.

여기서, 입력되는 제1언어 메시지는 음성 또는 텍스트 형태일 수 있으며, 특히 음성 메시지를 텍스트로 변환하는 형태일 수도 있다.Here, the input first language message may be in the form of voice or text, and in particular may be a form of converting the voice message into text.

상기 제1언어 메시지가 음성으로 입력될 경우, 상기 사용자단말기는 기등록된 식별 가능한 사용자 음성만을 인식하여 입력받으며, 사용자 음성으로 등록되지 않아 식별이 불가능한 음성은 인식하지 않고 필터링하게 된다.When the first language message is input by voice, the user terminal only recognizes and inputs only the previously registered identifiable user voice, and filters the voice without recognizing the voice that is not registered as the user voice.

이때, 상기 사용자 음성은 호흡, 발성, 발음 및 공명 조건에 따라 식별 가능하도록 상기 사용자단말기에 등록되며, 기타 다른 조건에 의해서도 사용자 음성이 식별 가능함은 물론이다. 덧붙여, 음성뿐만 아니라 외부 노이즈 제거를 위한 필터가 상기 사용자단말기에 적용될 수 있음은 물론이다.At this time, the user voice is registered in the user terminal so that it can be identified according to respiration, vocalization, pronunciation and resonance conditions, and the user voice can be identified by other conditions. In addition, it goes without saying that a filter for removing external noise as well as voice may be applied to the user terminal.

그리고, 상기 (S100)에서 상기 사용자단말기에 입력되는 제1언어 메시지는 기지정된 맞춤법 알고리즘에 의해 교정되는 것이 바람직하다. 즉, 텍스트 입력시 오타나 띄어쓰기, 마침표 등이 해당 언어의 맞춤법에 맞도록 교정될 수 있으며, 교정을 위한 맞춤법 알고리즘은 공지된 기술을 적용하거나 더 나아가 응용할 수도 있음은 자명하다.The first language message input to the user terminal in step S100 is preferably corrected by a pre-specified spelling algorithm. That is, it is obvious that a typographical error, a space, a period, and the like can be corrected in accordance with the spelling of the language, and the spelling algorithm for correction can be applied to a known technique or further applied.

다음으로, 상기 (S300)에서는 상기 서비스제공서버가 상기 제1언어를 제외한 언어 중 상기 제2언어와의 상호 자동번역된 비중에 기초하여 1차 자동번역을 위한 제3언어를 선정한다. 즉, 상기 제2언어와 가장 많은 번역이 이루어진 언어를 제3언어로 선정한다. 예를 들어, 제1언어가 한국어이고 제2언어가 영어인 경우 제3언어로 일본어가 선정될 수 있다. 이는 한국어와 영어의 자동번역 비중보다 일본어와 영어의 자동번역 비중이 높기 때문에 보다 많은 통계정보를 활용할 수 있기 때문이며, 통계정보가 많을수록 향상된 신뢰성을 도모할 수 있다. 특히, 한국어와 일본어는 어순이 같고 문법적으로 유사해 자동번역 정확도가 상당히 높으므로 교차 번역시 보다 향상된 정확도를 제공할 수 있는 것이다.Next, in step S300, the service providing server selects a third language for the first automatic translation based on the automatically weighted proportion of the languages other than the first language mutually translated with the second language. That is, the second language and the language in which the most translation is performed are selected as the third language. For example, if the first language is Korean and the second language is English, Japanese can be selected as the third language. This is because more automatic statistical information can be utilized because the automatic translation ratio of Japanese and English is higher than the automatic translation ratio of Korean and English, and the more the statistical information is, the more reliable the reliability can be achieved. Especially, since Korean and Japanese have the same word order and grammatical similarity, automatic translation accuracy is very high, so it is possible to provide improved accuracy in cross translation.

여기서, 제3언어 선정시 통계적 기계번역에 기반한다는 것은 인터넷상에서 컴퓨터가 참고 가능한 모든 번역문서(빅데이터)의 통계정보를 활용한다는 것이다. 이러한 통계적 기계번역은 대량의 말뭉치로부터 학습된 통계정보를 활용하는 것으로, 샤논(shannon)의 잡음채널에 기반을 두고 있다. 덧붙여, 통계기반의 기계번역 기술은 n-gram의 HMM을 사용하며, 오류 측정, 효과적인 학습, 문맥의존 lexicon 모델 구현, 효과적인 문 생성 방법 부문에서 다양한 형태의 혼합된 기술로서 구현이 가능하다.In this case, when selecting the third language, it is based on statistical machine translation that statistical information of all translation documents (big data) available for computers on the Internet is utilized. This statistical machine translation is based on Shannon's noise channel, which utilizes statistical information learned from large corpus. In addition, statistical-based machine translation techniques use n-gram HMMs and can be implemented as a variety of mixed techniques in error measurement, effective learning, contextual lexicon model implementation, and effective statement generation methods.

다음으로, 상기 (S500)에서는 상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제1언어 메시지를 제3언어 메시지로 1차 자동번역한다. 예를 들어, 제1언어가 한국어이면 어순과 문법이 유사한 일본어가 제3언어로 선정되어 1차 자동번역될 수 있다.Next, in step S500, the service providing server first automatically translates the first language message into a third language message through a predetermined machine translation. For example, if the first language is Korean, Japanese with a similar word order and grammar can be selected as a third language and automatically translated first.

여기서, 1차 자동 번역시 통계적 기계번역에 기반할 수 있으나 이해 한정되지는 않는다. 예를 들어, 형태소 치환방식, 직접방식, 변환방식, 중간언어방식, 예제방식 등 다양한 기계번역이 적어도 하나 이상 활용될 수 있다.Here, the first automatic translation may be based on statistical machine translation, but is not limited to understanding. For example, at least one of a variety of machine translations, such as morpheme substitution, direct method, conversion method, intermediate language method, and example method, can be utilized.

다음으로, 상기 (S700)에서는 상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제3언어 메시지를 상기 제2언어 메시지로 2차 자동번역한다. 예를 들어, 최종 목적 언어인 제2언어가 영어라면 일본어로 1차 자동번역된 메시지를 영어로 2차 자동번역하는 것이다.Next, in operation S700, the service providing server automatically translates the third language message into the second language message through a predetermined machine translation. For example, if the second language is English, the first automatic translation of the message in Japanese is automatically translated into English.

한편, 도3을 참조하면 알 수 있듯이, 상기 서비스제공서버가 상기 2차 자동번역된 제2언어 메시지를 통계적 기계번역을 기반으로 하는 기설정된 가중치 정보에 따라 적어도 하나의 형태소를 교정하는 단계(S800)를 더 포함할 수 있다. 즉, 최종 번역된 메시지에 가중치 정보를 적용시켜 불명확한 형태소를 교정함으로써 더욱 향상된 품질의 번역문을 제공할 수 있게 되는 것이다.Meanwhile, referring to FIG. 3, the service providing server may correct the at least one morpheme based on predetermined weight information based on the statistical machine translation of the second automatically translated second language message (S800 ). That is, by applying the weight information to the final translated message, the ambiguous morpheme can be corrected to provide a higher quality translation.

이때, 상기 형태소에 대한 가중치 정보가 일정 통계수치 미만이면 상기 형태소를 교정하지 않고, 상기 (S700)에서 2차 자동번역된 번역문을 최종 번역문으로 적용시킨다.At this time, if the weight information for the morpheme is less than a certain statistical value, the morpheme is not corrected, and the second automatically translated translation in S700 is applied as the final translation.

여기서, 상기 서비스제공서버가 상기 형태소에 대한 추천 번역어를 상기 가중치 정보에 기초해 적어도 둘 이상 추출하여 상기 사용자단말기로 전송할 수 있으며, 이때 상기 사용자단말기는 사용자로부터 추천 번역어 중 하나를 선택 입력받아 상기 형태소를 수동번역하여 교정하는 것을 특징으로 한다. 수동번역하여 교정된 번역문 결과는 상기 서비스제공서버로 전송되어 가중치 정보에 반영되는 것이 바람직하다.Here, the service providing server may extract at least two or more recommended translations of the morpheme based on the weight information, and transmit the selected translations to the user terminal. At this time, the user terminal selects one of the recommended translations from the user, Is corrected by manual translation. The translation result obtained by manual translation is preferably transmitted to the service providing server and reflected in the weight information.

덧붙여, 상기한 가중치 정보는 상기 형태소가 상기 제1언어 메시지에서 상기 제2언어 메시지로 번역되는 과정에서 수동번역된 횟수에 따라 수치화된 정보일 수 있으며, 상기 추천 번역어는 상기 수치화된 가중치 정보에 따라 내림차순으로 정렬될 수 있다.In addition, the weight information may be numerical information according to the number of manual translations in the process of translating the morpheme into the second language message from the first language message, and the recommendation translation may be based on the numerical weight information Can be sorted in descending order.

다음으로, 상기 (S900)에서는 서비스제공서버가 상기 번역된 제2언어 메시지를 상기 사용자단말기 및/또는 타 사용자단말기로 전송한다.Next, in step S900, the service providing server transmits the translated second language message to the user terminal and / or another user terminal.

여기서, 번역된 제2언어 메시지는 음성으로 출력될 수 있으며, 사용자가 번역된 메시지의 텍스트를 부분적으로 드래그하여 부분적으로만 음성으로 출력할 수도 있다.Here, the translated second language message may be outputted as a voice, and the user may partially drag the text of the translated message and partially output only the voice.

아울러, 사용자단말기를 통해 원문과 번역문을 함께 출력할 수 있도록 선택할 수 있으며, 자동번역이 완료된 번역문을 사용자가 직접 교정하여 메시지를 전송할 수도 있음은 자명한 사항이다.In addition, it is obvious that the user can select to output the original text and the translated text together through the user terminal, and the user can directly correct the translated text after the automatic translation is completed.

뿐만 아니라, 채팅 서비스시 사용자단말기를 통해 파악되는 위치정보를 이용해 해당 국가의 언어를 자동으로 인식하여 자동번역할 수 있으며, 채팅 서비스 사용자 간의 온라인 및 오프라인 표시는 물론 오프라인 상태에서도 자동번역을 활용하여 SMS, MMS, 이메일을 전송할 수 있다.In addition, it can automatically recognize and automatically translate the language of the country by using the location information that is recognized through the user terminal during the chat service. In addition to displaying online and offline among chat service users, , MMS, and email.

지금까지 설명한 본 발명의 실시예에 따르면, 다단의 교차 번역과 함께 가중치를 적용시킴으로써 번역 품질을 현저히 향상시키고 상용화에 근접한 수준의 신뢰성 있는 번역 서비스를 구현할 수 있는 효과가 있다.According to the embodiments of the present invention described above, by applying weights together with multi-stage cross-translation, translation quality can be remarkably improved and reliable translation service at a level close to commercialization can be implemented.

전술한 내용은 후술할 발명의 청구범위를 더욱 잘 이해할 수 있도록 본 발명의 특징과 기술적 장점을 다소 폭넓게 상술하였다. 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The foregoing has outlined rather broadly the features and technical advantages of the present invention in order that the claims of the invention to be described below may be better understood. It will be understood by those skilled in the art that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. The scope of the present invention is defined by the appended claims rather than the foregoing detailed description, and all changes or modifications derived from the appended claims and their equivalents should be construed as being included within the scope of the present invention.

Claims (7)

Translated fromKorean
제1언어를 제2언어로 번역하기 위한 다국어 번역 방법으로서,
사용자단말기가 사용자로부터 제1언어 메시지를 입력받아 서비스제공서버로 전송하는 단계(S100);
상기 서비스제공서버가 통계적 기계번역에 기반하여 상기 제1언어를 제외한 언어 중 상기 제2언어와의 상호 자동번역된 비중에 기초하여 1차 자동번역을 위한 제3언어를 선정하는 단계(S300); - 여기서, "통계적 기계번역에 기반"한다는 것은 인터넷상에서 컴퓨터가 참고 가능한 모든 번역문서(빅데이터)의 통계정보를 활용한다는 것임. -
상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제1언어 메시지를 제3언어 메시지로 1차 자동번역하는 단계(S500);
상기 서비스제공서버가 소정 방식의 기계번역을 통해 상기 제3언어 메시지를 상기 제2언어 메시지로 2차 자동번역하는 단계(S700); 및
상기 서비스제공서버가 상기 번역된 제2언어 메시지를 상기 사용자단말기 및/또는 타 사용자단말기로 전송하는 단계(S900);
를 포함하는 것을 특징으로 하는 다국어 번역 방법.
A multilingual translation method for translating a first language into a second language,
The user terminal receives the first language message from the user and transmits the first language message to the service providing server (S100).
A step S300 of selecting a third language for the first automatic translation on the basis of the automatically translated weight of the second language among the languages other than the first language based on statistical machine translation by the service providing server; - Here, "based on statistical machine translation" means that the statistical information of all translation documents (big data) available for computers on the Internet is utilized. -
The service providing server first automatically translating the first language message into a third language message through a predetermined machine translation (S500);
(S700) a second automatic translation of the third language message into the second language message through a machine translation of a predetermined method by the service providing server; And
Transmitting the translated second language message to the user terminal and / or another user terminal (S900);
And translating the multilingual translation data.
제1항에 있어서,
상기 (S100)에서 제1언어 메시지는 사용자 음성으로 입력되되,
상기 사용자 음성은 호흡, 발성, 발음 및 공명 조건에 따라 식별 가능하도록 상기 사용자단말기에 기등록되며,
상기 사용자단말기는 기등록된 식별 가능한 사용자 음성만을 인식하여 제1언어 메시지로 입력받는 것을 특징으로 하는 다국어 번역 방법.
The method according to claim 1,
In step S100, the first language message is input as a user voice,
The user's voice is previously registered in the user terminal so that the user's voice can be identified according to respiration, utterance, pronunciation and resonance conditions,
Wherein the user terminal recognizes only the previously registered identifiable user voice and receives the first language message.
제1항에 있어서,
상기 (S100)에서 상기 사용자단말기에 입력되는 제1언어 메시지는 기지정된 맞춤법 알고리즘에 의해 교정되는 것을 특징으로 하는 다국어 번역 방법.
The method according to claim 1,
Wherein the first language message input to the user terminal in step (S100) is corrected by a pre-specified spelling algorithm.
제1항에 있어서,
상기 서비스제공서버가 상기 2차 자동번역된 제2언어 메시지를 통계적 기계번역을 기반으로 하는 기설정된 가중치 정보에 따라 적어도 하나의 형태소를 교정하는 단계(S800);
를 더 포함하는 것을 특징으로 하는 다국어 번역 방법.
The method according to claim 1,
(S800) correcting at least one morpheme based on predetermined weight information based on statistical machine translation of the second automatically translated second language message by the service providing server;
Further comprising the steps of:
제4항에 있어서,
상기 (S800)에서는,
상기 서비스제공서버가 상기 형태소에 대한 추천 번역어를 상기 가중치 정보에 기초해 적어도 둘 이상 추출하여 상기 사용자단말기로 전송하며,
상기 사용자단말기는 사용자로부터 추천 번역어 중 하나를 선택 입력받아 상기 형태소를 수동번역하여 교정하는 것을 특징으로 하는 다국어 번역 방법.
5. The method of claim 4,
In step S800,
The service providing server extracts at least two recommended translations for the morpheme based on the weight information, and transmits the extracted translations to the user terminal,
Wherein the user terminal selects and inputs one of the recommended translations from the user and manually corrects the morpheme by correcting the morpheme.
제5항에 있어서,
상기 가중치 정보는 상기 형태소가 상기 제1언어 메시지에서 상기 제2언어 메시지로 번역되는 과정에서 수동번역된 횟수에 따라 수치화된 정보이며,
상기 추천 번역어는 상기 수치화된 가중치 정보에 따라 내림차순으로 정렬되는 특징으로 하는 다국어 번역 방법.
6. The method of claim 5,
Wherein the weight information is information digitized according to the number of manual translations in the process of translating the morpheme from the first language message to the second language message,
Wherein the recommendation translation is arranged in descending order according to the numerical weight information.
제4항에 있어서,
상기 형태소에 대한 가중치 정보가 일정 통계수치 미만이면 상기 형태소를 교정하지 않는 것을 특징으로 하는 다국어 번역 방법.
5. The method of claim 4,
And if the weight information for the morpheme is less than a certain statistical value, the morpheme is not corrected.
KR1020150158521A2015-11-122015-11-12Multilingual translation methodExpired - Fee RelatedKR101740671B1 (en)

Priority Applications (2)

Application NumberPriority DateFiling DateTitle
KR1020150158521AKR101740671B1 (en)2015-11-122015-11-12Multilingual translation method
PCT/KR2015/012569WO2017082445A1 (en)2015-11-122015-11-23Multilingual translation method

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
KR1020150158521AKR101740671B1 (en)2015-11-122015-11-12Multilingual translation method

Publications (2)

Publication NumberPublication Date
KR20170055630Atrue KR20170055630A (en)2017-05-22
KR101740671B1 KR101740671B1 (en)2017-05-26

Family

ID=58695571

Family Applications (1)

Application NumberTitlePriority DateFiling Date
KR1020150158521AExpired - Fee RelatedKR101740671B1 (en)2015-11-122015-11-12Multilingual translation method

Country Status (2)

CountryLink
KR (1)KR101740671B1 (en)
WO (1)WO2017082445A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
KR20200064972A (en)*2018-08-012020-06-08김민철Apparatus and Method for Providing Translation Service
KR20230025228A (en)*2021-08-132023-02-21주식회사 애니챗Method for translating an instant message into multiple languages in real-time

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
KR102516363B1 (en)2018-01-262023-03-31삼성전자주식회사Machine translation method and apparatus
KR102390154B1 (en)*2020-09-082022-04-25고려대학교 산학협력단correction performance evaluation metrics of neural network machine translation and method of constructing the same

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP4410486B2 (en)*2003-05-122010-02-03インターナショナル・ビジネス・マシーンズ・コーポレーション Machine translation apparatus and program
KR100643801B1 (en)*2005-10-262006-11-10엔에이치엔(주) System and method for providing autocompletion recommendation language linking multiple languages
US8959011B2 (en)*2007-03-222015-02-17Abbyy Infopoisk LlcIndicating and correcting errors in machine translation systems
US8655644B2 (en)*2009-09-302014-02-18International Business Machines CorporationLanguage translation in an environment associated with a virtual application
US8862456B2 (en)*2012-03-232014-10-14Avaya Inc.System and method for automatic language translation for applications
KR20140079543A (en)*2012-12-142014-06-27한국전자통신연구원Auto Interpreting and Translating apparatus
KR101406981B1 (en)*2013-09-172014-06-13김길원System and Method for Translating Messages of Multiple Languages

Cited By (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
KR20200064972A (en)*2018-08-012020-06-08김민철Apparatus and Method for Providing Translation Service
KR20230025228A (en)*2021-08-132023-02-21주식회사 애니챗Method for translating an instant message into multiple languages in real-time

Also Published As

Publication numberPublication date
KR101740671B1 (en)2017-05-26
WO2017082445A1 (en)2017-05-18

Similar Documents

PublicationPublication DateTitle
US11113234B2 (en)Semantic extraction method and apparatus for natural language, and computer storage medium
CN111177324B (en)Method and device for carrying out intention classification based on voice recognition result
KR101694286B1 (en)Apparatus and method for providing two-way automatic interpretation and tranlating service
CN103744843B (en)A kind of online voice translation method and device
US20190138606A1 (en)Neural network-based translation method and apparatus
CN101133411A (en) Error-tolerant romanization input method for non-roman characters
US20150228280A1 (en)Voice conversation support apparatus, voice conversation support method, and computer readable medium
CN111460793A (en) Error correction method, apparatus, equipment and storage medium
KR101740671B1 (en)Multilingual translation method
CN108304389B (en)Interactive voice translation method and device
KR20130018205A (en)Method for disambiguating multiple readings in language conversion
CN111209740A (en)Text model training method, text error correction method, electronic device and storage medium
KR101709693B1 (en)Method for Web toon Language Automatic Translating Using Crowd Sourcing
CN116522966B (en)Text translation method and system based on multilingual vocabulary entry
CN109062891B (en)Media processing method, device, terminal and medium
CN110929514A (en) Text proofreading method, apparatus, computer-readable storage medium and electronic device
CN115455981B (en)Semantic understanding method, device and equipment for multilingual sentences and storage medium
US20220284188A1 (en)Machine based expansion of contractions in text in digital media
CN104834633A (en)Cloud translation input method and system
CN113688625B (en) A language recognition method and device
KR102354898B1 (en)Vocabulary list generation method and device for Korean based neural network language model
KR101543024B1 (en) Pronunciation-based translation method and apparatus
CN110147556B (en)Construction method of multidirectional neural network translation system
CN114925679B (en)Interaction method, device, electronic equipment and storage medium
KR102333611B1 (en)Device, method and computer program for providing multilingual assistant service

Legal Events

DateCodeTitleDescription
A201Request for examination
PA0109Patent application

St.27 status event code:A-0-1-A10-A12-nap-PA0109

PA0201Request for examination

St.27 status event code:A-1-2-D10-D11-exm-PA0201

PE0902Notice of grounds for rejection

St.27 status event code:A-1-2-D10-D21-exm-PE0902

R17-X000Change to representative recorded

St.27 status event code:A-3-3-R10-R17-oth-X000

T11-X000Administrative time limit extension requested

St.27 status event code:U-3-3-T10-T11-oth-X000

E13-X000Pre-grant limitation requested

St.27 status event code:A-2-3-E10-E13-lim-X000

P11-X000Amendment of application requested

St.27 status event code:A-2-2-P10-P11-nap-X000

P13-X000Application amended

St.27 status event code:A-2-2-P10-P13-nap-X000

PE0701Decision of registration

St.27 status event code:A-1-2-D10-D22-exm-PE0701

GRNTWritten decision to grant
PG1501Laying open of application

St.27 status event code:A-1-1-Q10-Q12-nap-PG1501

PR0701Registration of establishment

St.27 status event code:A-2-4-F10-F11-exm-PR0701

PR1002Payment of registration fee

St.27 status event code:A-2-2-U10-U11-oth-PR1002

Fee payment year number:1

PG1601Publication of registration

St.27 status event code:A-4-4-Q10-Q13-nap-PG1601

P22-X000Classification modified

St.27 status event code:A-4-4-P10-P22-nap-X000

P22-X000Classification modified

St.27 status event code:A-4-4-P10-P22-nap-X000

P22-X000Classification modified

St.27 status event code:A-4-4-P10-P22-nap-X000

PR1001Payment of annual fee

St.27 status event code:A-4-4-U10-U11-oth-PR1001

Fee payment year number:4

PR1001Payment of annual fee

St.27 status event code:A-4-4-U10-U11-oth-PR1001

Fee payment year number:5

R18-X000Changes to party contact information recorded

St.27 status event code:A-5-5-R10-R18-oth-X000

PR1001Payment of annual fee

St.27 status event code:A-4-4-U10-U11-oth-PR1001

Fee payment year number:6

PR1001Payment of annual fee

St.27 status event code:A-4-4-U10-U11-oth-PR1001

Fee payment year number:7

PC1903Unpaid annual fee

St.27 status event code:A-4-4-U10-U13-oth-PC1903

Not in force date:20240523

Payment event data comment text:Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903Unpaid annual fee

St.27 status event code:N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text:Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date:20240523


[8]ページ先頭

©2009-2025 Movatter.jp