

본 발명은 인공지능에 기반하여 해상도를 개선하는 서비스를 제공하는 시스템에 관한 것이다.The present invention relates to a system for providing a service for improving resolution based on artificial intelligence.
현대의 디스플레이들은 높은 스페이스 해상도의 정적(static) 및 비디오 이미지를 제공한다. 그러나, 그러한 장치들의 입력에서 표준 이미지 신호의 스페이스 해상도는 훨씬 더 낮다. 현재 다양한 방법 및 장치들이 이미지의해상도 개선에 사용된다.Modern displays provide static and video images of high spatial resolution. However, the spatial resolution of a standard image signal at the input of such devices is much lower. Currently, various methods and devices are used to improve the resolution of an image.
증가된 시간 간극(time aperture)을 가진 비디오 이미지의 해상도 개선 방법 NEDI("New Edge-Directed Interpolation")(J. A. Leitao, M. Zhao, G. de Haan "Content adaptive video up-scaling for High definition displays", Proceedings of IVCP 2003.5022, 20-24 January 2003. ES [1])가 알려져 있다. 이 방법에서는, 비디오 이미지의 현재 프레임을 프로세싱하기 위해 이웃하는 프레임들로부터의 데이터가 사용되고, 픽셀 계수들은 최소 자승법(least squares method)을 사용하여 결정된다. 최소 자승법이 오히려 계산하기 복잡할 때, 그것은 단지 이미지의 지역 픽셀들(regional pixels)에 대해서만 사용되고, 다른 픽셀들의 계수들은 바이리니어 보간(bilinear interpolation)에 의해서 계산된다.How to improve the resolution of video images with increased time aperture NEDI ("New Edge-Directed Interpolation") (J. A. Leitao, M. Zhao, G. de Haan "Content adaptive video up-scaling for High definition displays") , Proceedings of IVCP 2003.5022, 20-24 January 2003. ES [1]) are known. In this method, data from neighboring frames is used to process the current frame of the video image, and pixel coefficients are determined using the least squares method. When the least squares method is rather complicated to calculate, it is used only for regional pixels of the image, and the coefficients of other pixels are calculated by bilinear interpolation.
본 발명에 가장 가까운 것은 미국 특허 제6,714,693호 [2]에 개시된 이미지 해상도 증가 장치 및 방법으로, 여기서 최소 및 최대 필터링(filtrations)의 결과들은 픽셀들의 분류에 사용되고, 그리고나서 적절한 보간 방법, 즉 가장 인접한 이웃들의 선형 또는 비선형 보간의 적용에 사용된다. 상기 장치 및 방법은 본 발명의 프로토타입(prototype)으로 선택된다.The closest to the present invention is an image resolution increasing apparatus and method disclosed in US Pat. No. 6,714,693 [2], wherein the results of minimum and maximum filtrations are used for classification of pixels, and then an appropriate interpolation method, i.e., the nearest It is used to apply linear or non-linear interpolation of neighbors. The apparatus and method are chosen as prototypes of the present invention.
위에서 설명된 유사물 및 상기 본 발명의 프로토타입의 단점은 최초로 확산하는(diffuse) 이미지들의 선명도를 향상시키지 않는 결과 최종 이미지의 품질이 불충분하게 높고, 그 방법은 또한 복잡한 동작들을 포함하며, 결과적으로 낮은 속도의 실행을 가지고 커다란 계산 리소스들(resources)을 요구한다는 것이다.Disadvantages of the analogues described above and of the prototype of the present invention are that the quality of the final image is insufficiently high as a result of not improving the sharpness of the initially diffuse images, the method also includes complex operations, as a result It has a low speed of execution and requires large computational resources.
본 발명의 실시 예에 따른 해상도 개선 시스템은 사용자 기기 측 요청에 대응하여, 요청된 비디오 데이터를 사용자 기기로 전송하는 서비스를 수행하되, 보유한 비디오 데이터를 기반으로 이미지 정보의 해상도 개선을 위한 인공신경망 알고리즘 동작에 요구되는 범용 신경망 파일을 생성하고, 상기 생성된 범용 신경망 파일 및 해상도를 기 설정된 수준 이하로 변경한 저화질 비디오 데이터를 상기 사용자 기기로 전송하는 서버; 및 상기 서버로부터 수신되는 저화질 비디오 데이터에 상기 수신된 범용 신경망 파일을 적용한 인공신경망 알고리즘에 기반한 연산 동작을 수행하고, 상기 연산 동작에 따라 상기 저화질 비디오 데이터의 해상도를 개선하고, 상기 해상도가 개선된 비디오 데이터를 재생하는 사용자 기기;를 포함하여 구성될 수 있다.A resolution improvement system according to an embodiment of the present invention performs a service of transmitting the requested video data to the user device in response to a request from the user device side, and an artificial neural network algorithm for improving the resolution of image information based on the retained video data a server that generates a general-purpose neural network file required for operation, and transmits to the user device low-quality video data obtained by changing the created general-purpose neural network file and resolution to a preset level or less; and performing a computation operation based on an artificial neural network algorithm in which the received general-purpose neural network file is applied to the low-quality video data received from the server, and improves the resolution of the low-quality video data according to the computation operation, and the resolution is improved video It may be configured to include; a user device that reproduces data.
본 발명의 실시 예는 영상 데이터를 제공하는 측에서 저화질 데이터를 송신하더라도 해당 영상을 재생할 시, 신경망 파일에 기반하여 해상도를 개선할 수 있음에 따라, 고화질 데이터 대신 저화질 데이터로 데이터 송수신이 이루어지도록 하는 환경 기반을 제공할 수 있다. 이에 따라 본 발명은 고용량의 고화질 영상 데이터를 송신하는 경우에 발생되는 전송 속도 저하 문제를 해결하는 효과가 있다.According to an embodiment of the present invention, even when the image data provider transmits low-quality data, when the image is reproduced, the resolution can be improved based on the neural network file, so data transmission and reception is performed with low-quality data instead of high-quality data. It can provide an environmental foundation. Accordingly, the present invention is effective in solving the problem of a reduction in transmission speed that occurs when high-capacity high-definition image data is transmitted.
또한 본 발명은 저화질 영상만을 보유하더라도 동영상 실행 당시 신경망 파일을 통해 고화질로 변환할 수 있도록 하므로, 비교적 메모리 용량을 적게 차지하게되는 효과가 있다.In addition, the present invention has the effect of occupying a relatively small amount of memory because even if only a low-quality image can be converted to a high-quality image through a neural network file at the time of running the video.
도 1은 본 발명의 실시 예에 따른 해상도 개선 시스템을 도시한 도면이다.
도 2는 본 발명의 실시 예에 장치의 구성도이다.1 is a diagram illustrating a resolution improvement system according to an embodiment of the present invention.
2 is a block diagram of an apparatus according to an embodiment of the present invention.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.Since the present invention can have various changes and can have various embodiments, specific embodiments are illustrated in the drawings and described in detail.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.However, this is not intended to limit the present invention to specific embodiments, and it should be understood to include all modifications, equivalents and substitutes included in the spirit and scope of the present invention. In describing each figure, like reference numerals have been used for like elements.
어떤 구성요소가 다른 구성요소에 '연결되어' 있다거나 '접속되어'있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 '직접 연결되어'있다거나 '직접 접속되어'있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is referred to as being 'connected' or 'connected' to another component, it may be directly connected or connected to the other component, but it is understood that other components may exist in between. it should be On the other hand, when it is mentioned that a certain element is 'directly connected' or 'directly connected' to another element, it should be understood that the other element does not exist in the middle.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, '포함하다' 또는 '가지다' 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. The singular expression includes the plural expression unless the context clearly dictates otherwise. In the present application, terms such as 'comprise' or 'have' are intended to designate that a feature, number, step, operation, component, part, or combination thereof described in the specification exists, and one or more other features It should be understood that this does not preclude the existence or addition of numbers, steps, operations, components, parts, or combinations thereof.
본 발명에 따른 이미지 해상도 개선 장치는 RGB-to-HSV 스페이스 컨버터(1) 및 HSV-to-RGB 스페이스 컨버터(2)를 포함하고, 그들 각각은 색, 채도 및 휘도의 채널들의 세 개의 메모리 블록들(3,4,5 및6,7,8)을 포함하며, 블록(3,4,5)의 출력들은 해상도 개선 블록(9,10,11)의 입력들에 연결되고, 해상도 개선 블록(9,10,11)의 출력들은 메모리 블록(6,7,8)의 입력들에 연결된다. 해상도 개선 블록(9,10,11)의 각각의 입력에서는, 패럴렐 모드로 설치된 이차원 최소 필터(12), 이차원 최대 필터(13) 및 이차원 바이리니어 인터폴레이터(16)를 볼 수 있다. 이차원 최소 필터(12)의 출력은 0차 이차원 인터폴레이터(14)의 입력에 연결된다. 이차원 최대 필터(13)의 출력은 0차 이차원 인터폴레이터(15)의 입력에 연결된다. 0차 이차원 인터폴레이터(14)의 출력은 멀티플렉서(20)의 제1 데이터 입력에 연결된다. 0차 이차원 인터폴레이터(15)의 출력은 멀티플렉서(20)의 제2 데이터 입력에 연결된다. 0차 이차원 인터폴레이터(14) 및 이차원 바이리니어 인터폴레이터(16)의 출력들의 차는 모듈 계산 블록(17)의 입력으로 전송된다. 0차 이차원 인터폴레이터(15) 및 이차원 바이리니어 인터폴레이터(16)의 출력들의 차는 모듈 계산 블록(18)의 입력으로 전송된다. 모듈 계산 블록(17,18)의 출력들은 비교기(19)의 입력들에 연결되고, 비교기(19)의 출력은 멀티플렉서(20)의 선택 입력에 연결된다. 멀티플렉서(20)의 출력들은 대응하는 해상도 개선 블록(9,10,11)의 출력들을 나타낸다. 해상도 개선 블록(9,10,11)의 출력들은 HSV 포맷의 RGB 포맷으로의 컨버터(2)의 메모리 블록(6,7,8)의 대응하는 입력들에 연결된다.An apparatus for improving image resolution according to the present invention includes an RGB-to-HSV space converter 1 and an HSV-to-RGB space converter 2, each of which includes three memory blocks of channels of color, saturation and luminance (3,4,5 and 6,7,8), the outputs of block (3,4,5) are connected to the inputs of resolution enhancement block (9,10,11), resolution enhancement block (9) The outputs of ,10,11 are connected to the inputs of the memory blocks 6,7,8. At the respective inputs of the resolution improvement blocks 9, 10 and 11, the two-dimensional minimum filter 12, the two-dimensional maximum filter 13 and the two-dimensional bilinear interpolator 16 installed in parallel mode can be seen. The output of the two-dimensional minimum filter 12 is connected to the input of the zero-order two-dimensional interpolator 14 . The output of the two-dimensional maximum filter 13 is connected to the input of the zero-order two-dimensional interpolator 15 . The output of the zero-order two-dimensional interpolator 14 is connected to a first data input of a multiplexer 20 . The output of the zero-order two-dimensional interpolator 15 is connected to a second data input of the multiplexer 20 . The difference of the outputs of the zero-order two-dimensional interpolator 14 and the two-dimensional bilinear interpolator 16 is transmitted as an input of the module calculation block 17 . The difference of the outputs of the zero-order two-dimensional interpolator 15 and the two-dimensional bilinear interpolator 16 is transmitted as an input of the module calculation block 18 . The outputs of the module calculation blocks 17 , 18 are connected to the inputs of the comparator 19 , and the output of the comparator 19 is connected to the select input of the multiplexer 20 . The outputs of the multiplexer 20 represent the outputs of the corresponding resolution enhancement blocks 9 , 10 , 11 . The outputs of the resolution enhancement block 9 , 10 , 11 are connected to corresponding inputs of the memory block 6 , 7 , 8 of the converter 2 from HSV format to RGB format.
픽셀들로 구성된 이미지에 대하여 다음의 동작들이 실행된다. 최초 이미지의 변환은 RGB 포맷으로부터 HSV 포맷으로 실시된다(의 컨버터(1)에서); 이미지의 세 개의 채널들, 즉 색, 채도 및 휘도가 선택되고, 각각의 채널에 대응하는 데이터가 저장된다( 메모리 블록(3,4,5)에)(단계 1). 이미지는 세 개의 채널들의 각각에서 보간되고(해상도 개선 블록(9,10,11)에서), 그 후에 다음의 동작들이 실시된다(블록 (9,10,11)의 각각에서): 이미지의 최소 필터링(filtration)이 실시되고(최소 이차원 필터에서) 이미지의 각각의 픽셀의 값은 세트 부근에 픽셀의 최소 값과 대체된다(단계 2). 최대 이차원 필터( 필터(13))에서 이미지의 최대 필터링이 실시되고 이미지의 각각의 픽셀의 값은 세트 부근에서 픽셀의 최대 값과 대체된다(단계 3).The following operations are performed on an image composed of pixels. The conversion of the original image is carried out from RGB format to HSV format (in converter 1 of ); Three channels of the image are selected, namely color, saturation and luminance, and data corresponding to each channel is stored (in memory blocks 3, 4, 5) (step 1). The image is interpolated in each of the three channels (in resolution enhancement block (9,10,11)), after which the following operations are performed (in each of blocks (9,10,11)): minimal filtering of the image A filtration is performed (in a minimal two-dimensional filter) and the value of each pixel in the image is replaced with the smallest value of the pixel in the vicinity of the set (step 2). In a maximum two-dimensional filter (filter 13) maximum filtering of the image is performed and the value of each pixel of the image is replaced with the maximum value of the pixel in the vicinity of the set (step 3).
이차원 인터폴레이터(의 16)에서 이미지의 예비 해상도 개선이 실시된다(단계 4). 최소 필터링의 결과는 0차 이차원 인터폴레이터( 14)에서 보간된다(단계 5). 최대 필터링의 결과는 제2 이차원 인터폴레이터( 15)에서 보간된다(단계 6). 또한, 바이리니어 보간의 결과로써 생성되는 이미지의 각각의 픽셀에 대해, 다음의 동작들이 실시된다. 차이 모듈의 값 M1은 바이리니어 보간의 결과로써 생성된 픽셀 및 최소 필터링의 보간된 결과의 사이에서 결정된다( 제1 모듈 계산 블록(17)에서)(단계 7). 차이 모듈의 값 M2는 바이리니어 보간의 결과로써 생성된 픽셀 및 최대 필터링의 보간된 결과의 사이에서 결정된다( 제2 모듈 계산 블록(18)에서)(단계 8). M1 및 M2 값은 비교된다( 비교기(19)에서)(단계 9). M1이 M2를 초과하는 경우에, 제20차 인터폴레이터의 출력으로부터 최대 필터링의 결과의 보간된 값은 현재의 채널에 의존하는 메모리 블록에 저장된다(단계 10). M1이 M2를 초과하지 않는 경우에, 제1 0차 인터폴레이터의 출력으로부터 최소 필터링의 결과의 보간된 값은 (현재의 채널 - 색, 채도, 휘도에 의존하는) 메모리 블록에 저장된다(단계 11). 이 동작은 이 경우에는 멀티플렉서(20)에서 실행된다.A preliminary resolution enhancement of the image in the two-dimensional interpolator (16) is performed (step 4). The result of the minimum filtering is interpolated in a zero-order two-dimensional interpolator 14 (step 5). The result of maximum filtering is interpolated in the second two-dimensional interpolator 15 (step 6). Further, for each pixel of an image generated as a result of bilinear interpolation, the following operations are performed. A value M1 of the difference module is determined between the pixel produced as a result of the bilinear interpolation and the interpolated result of the minimum filtering (in the first module calculation block 17) (step 7). A value M2 of the difference module is determined between the pixel generated as a result of the bilinear interpolation and the interpolated result of the maximum filtering (in the second module calculation block 18) (step 8). The M1 and M2 values are compared (in comparator 19) (step 9). If M1 exceeds M2, the interpolated value of the result of maximum filtering from the output of the twentieth-order interpolator is stored in a memory block dependent on the current channel (step 10). If M1 does not exceed M2, the interpolated value of the result of minimal filtering from the output of the first zero-order interpolator is stored in a memory block (depending on the current channel - color, saturation, luminance) (step 11) ). This operation is performed in the multiplexer 20 in this case.
메모리 블록(6,7,8)에 저장된 HSV 포맷의 보간된 이미지 데이터의 RGB 포맷으로의 변환은 HSV-to-RGB 스페이스 컨버터(2)에서 실시된다(단계 12). 본 방법은 FPGA, ASIC의 형태로 구현될 수 있다.Conversion of the interpolated image data in the HSV format to the RGB format stored in the memory blocks 6, 7, and 8 is performed in the HSV-to-RGB space converter 2 (step 12). The method may be implemented in the form of an FPGA or an ASIC.
도 1은 본 발명의 실시 예에 따른 해상도 개선 시스템을 도시한 도면이다.1 is a diagram illustrating a resolution improvement system according to an embodiment of the present invention.
본 발명의 실시 예에 따른 해상도 개선 시스템은 도 1에서 도시되는 바와 같이, 서버 100와 사용자 기기 200를 포함하여 구성될 수 있다.As shown in FIG. 1 , the resolution improvement system according to an embodiment of the present invention may be configured to include a
일 실시 예에 따라, 상기 서버 100는 사용자 기기 200에 VOD 서비스를 제공하는 서버를 포함할 수 있다.According to an embodiment, the
상기 서버 100는 사용자 기기 200에 VOD 서비스를 제공하기 위해 비디오 데이터를 전송할 수 있다. 그리고 본 발명의 실시 예에 따라 상기 서버 100는 비디오 데이터의 화질을 개선하기 위해 요구되는 신경망 파일을 산출하고 이를 사용자 기기 200에 함께 전송할 수 있다. 이에 따라 상기 사용자 기기 200는 서버 100로부터 제공받은 비디오 데이터를 수신한 신경망 파일에 기반하여 화질을 개선시킬 수 있게 된다.The
또한 상기 사용자 기기 200는 서버 200에 전송받고자 하는 비디오 데이터를 선택하고 전송 요청할 수 있다. 그리고 상기 사용자 기기 200는 자신의 비디오 데이터의 선택 정보, 재생 정보에 기반하여 산출된 사용자 시청 패턴 정보를 산출하고 이를 상기 서버 200에 전송할 수 있다.In addition, the
사용자 기기 200는 도 2에서 도시되는 바와 같이, 비디오 파일을 신경망 파일을 통해 해상도가 개선된 비디오 파일을 생성할 수 있다. 이 때 본 발명의 실시 예예 따라 상기 신경망 파일은 비디오 파일의 종류와 관계없이 사용 가능한 범용 파일이며, 그에 따라 상기 신경망 파일은 사용자 기기 200로 전송된 어느 비디오 파일과 결합하여 해상도를 개선시킬 수 있다.As shown in FIG. 2 , the
또한 다양한 실시 예에 따라 사용자 기기 200는 상기 범용 신경망 파일을 임베디드 소프트웨어로 탑재하고, 화질 개선의 대상이 되는 비디오파일을 서버 100(예, 동영상 스트리밍 서버)로부터 수신할 수도 있다.In addition, according to various embodiments, the
본 발명의 실시 예에 따른 상기 서버 100는 에서 도시되는 바와 같이, 통신부 110, 저장부 120, 제어부 130를 포함하여 구성될 수 있다. 그리고 상기 제어부 130는 자료 가공부 131, 신경망 학습부 132, 결과 평가부 133, 사용패턴 산출부 134를 포함하여 구성될 수 있다.As shown in , the
먼저, 상기 통신부 110는 사용자 디바이스와 서버 간의 데이터 송수신을 위해 네트워크를 이용할 수 있으며 상기 네트워크의 종류는 특별히 제한되지 않는다. 상기 네트워크는 예를 들어, 인터넷 프로토콜(IP)을 통하여 대용량 데이터의 송수신 서비스를 제공하는 아이피(IP: Internet Protocol)망 또는 서로 다른 IP 망을 통합한 올 아이피(All IP) 망일 수 있다. 또한, 상기 네트워크는 유선망, Wibro(Wireless Broadband)망, WCDMA를 포함하는 이동통신망, HSDPA(High Speed Downlink Packet Access)망 및 LTE(Long Term Evolution) 망을 포함하는 이동통신망, LTE advanced(LTE-A), 5G(Five Generation)를 포함하는 이동통신망, 위성 통신망 및 와이파이(Wi-Fi)망 중 하나 이거나 또는 이들 중 적어도 하나 이상을 결합하여 이루어질 수 있다.First, the communication unit 110 may use a network for data transmission/reception between a user device and a server, and the type of the network is not particularly limited. The network may be, for example, an IP (Internet Protocol) network that provides a large-capacity data transmission/reception service through the Internet Protocol (IP) or an All IP network that integrates different IP networks. In addition, the network includes a wired network, a Wibro (Wireless Broadband) network, a mobile communication network including WCDMA, a High Speed Downlink Packet Access (HSDPA) network, and a Long Term Evolution (LTE) network including a mobile communication network, LTE advanced (LTE-A) ), a mobile communication network including 5G (Five Generation), a satellite communication network, and a Wi-Fi network, or a combination of at least one or more of them.
본 발명의 실시 예에 따른 상기 통신부 110는 외부 웹 서버 및 다수의 사용자 기기 등과의 데이터 통신을 수행할 수 있다. 예컨데, 상기 통신부 110는 타 웹 서버 또는 사용자 기기(관리자용 기기 포함)들로부터 이미지가 포함되는 콘텐츠 데이터(사진 및 동영상)을 수신할 수 있다. 그리고 상기 서버 100는 VOD 서비스를 제공하는 서버를 포함함에 따라, 사용자 요청에 대응하는 VOD 콘텐츠를 사용자 기기 200로 전송할 수 있다.The communication unit 110 according to an embodiment of the present invention may perform data communication with an external web server and a plurality of user devices. For example, the communication unit 110 may receive content data (photos and videos) including images from other web servers or user devices (including administrator devices). In addition, since the
다양한 실시 예에 따라 상기 통신부 110는 VOD 서비스를 위해 VOD 파일의 수신 및 송신을 수행할 수 있으나, 이에 한정되는 것은 아니며, 상기 통신부 110는 해상도 개선용 신경망 파일을 생성하기 위해 요구되는 학습 데이터들을 수집하기 위한 통신 기능을 수행할 수 있다.According to various embodiments, the communication unit 110 may receive and transmit a VOD file for a VOD service, but is not limited thereto, and the communication unit 110 collects learning data required to generate a neural network file for resolution improvement. communication function for
상기 신경망 파일은 인공신경망 알고리즘을 통해 손상된 영상 데이터의 해상도를 원본 데이터와 유사하게 복원시키기 위해 필요한 정보들을 담은 것일 수 있으며, 인공신경망 알고리즘 구동시 선택되어야 하는 각종 파라미터들에 관한 정보를 포함하고 있을 수 있다.The neural network file may contain information necessary to restore the resolution of image data damaged through an artificial neural network algorithm to be similar to the original data, and may include information on various parameters to be selected when the artificial neural network algorithm is driven. have.
상기 저장부 120는 예를 들면, 내장 메모리 또는 외장 메모리를 포함할 수 있다. 내장메모리는, 예를 들면, 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(non-volatile Memory)(예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, 플래시 메모리(예: NAND flash 또는 NOR flash 등), 하드 드라이브, 또는 솔리드 스테이트 드라이브(solid state drive(SSD)) 중 적어도 하나를 포함할 수 있다.The storage unit 120 may include, for example, an internal memory or an external memory. The internal memory includes, for example, a volatile memory (eg, dynamic RAM (DRAM), static RAM (SRAM), or synchronous dynamic RAM (SDRAM), etc.), non-volatile memory (eg, OTPROM (one time programmable ROM), programmable ROM (PROM), erasable and programmable ROM (EPROM), electrically erasable and programmable ROM (EEPROM), mask ROM, flash ROM, flash memory (such as NAND flash or NOR flash), hard drive, or a solid state drive (SSD).
외장 메모리는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), XD(extreme digital), MMC(multi-media card) 또는 메모리 스틱(memory stick) 등을 더 포함할 수 있다. 외장 메모리는 다양한 인터페이스를 통하여 전자 장치와 기능적으로 및/또는 물리적으로 연결될 수 있다.External memory is a flash drive, for example, CF (compact flash), SD (secure digital), Micro-SD (micro secure digital), Mini-SD (mini secure digital), XD (extreme digital), It may further include a multi-media card (MMC) or a memory stick. The external memory may be functionally and/or physically connected to the electronic device through various interfaces.
본 발명의 실시 예에 따른 상기 저장부 120는 사용자 기기(관리자 기기) 또는 타 웹 서버로부터 수신된 이미지 데이터(예, 사진 및 비디오 데이터)를 가공한 가공 데이터(원본 이미지 데이터를 일정 비율로 축소한 데이터, 또는 축소한 후 원본 데이터 사이즈로 확대한 데이터)와 대응하는 원본 데이터를 매칭하여 저장할 수 있다. 상기 원본 데이터와 가공데이터는 각각 해상도 감소 시 발생되는 격자 현상에 대한 정보를 추출하는 데 사용될 수 있다.The storage unit 120 according to an embodiment of the present invention is processed data (original image data reduced at a certain rate) obtained by processing image data (eg, photo and video data) received from a user device (administrator device) or another web server. data, or data that has been reduced and then enlarged to the original data size) and the corresponding original data may be matched and stored. The original data and the processed data may be used to extract information about a lattice phenomenon that occurs when the resolution is reduced, respectively.
또한 상기 저장부 120는 격자 현상에 대한 정보 추출 이후 인공지능 알고리즘(예, SRCNN)을 통해 가공데이터에 존재하는 격자를 제거하여 해상도를 원본 이미지 수준으로 복원하기 위한 데이터인 신경망 파일을 저장할 수 있다.In addition, the storage unit 120 may store a neural network file, which is data for restoring the resolution to the original image level by removing the grid existing in the processed data through an artificial intelligence algorithm (eg, SRCNN) after extracting information on the grid phenomenon.
상기 제어부 130는 프로세서(Processor), 컨트롤러(controller), 마이크로 컨트롤러(microcontroller), 마이크로 프로세서(microprocessor), 마이크로 컴퓨터(microcomputer) 등으로도 호칭될 수 있다. 한편, 제어부는 하드웨어(hardware) 또는 펌웨어(firmware), 소프트웨어, 또는 이들의 결합에 의해 구현될 수 있다.The controller 130 may also be referred to as a processor, a controller, a microcontroller, a microprocessor, a microcomputer, or the like. Meanwhile, the control unit may be implemented by hardware, firmware, software, or a combination thereof.
펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 일 실시예는 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차, 함수 등의 형태로 구현될 수 있다. 소프트웨어 코드는 메모리에 저장되어 제어부에 의해 구동될 수 있다. 메모리는 상기 사용자 단말 및 서버 내부 또는 외부에 위치할 수 있으며, 이미 공지된 다양한 수단에 의해 상기 제어부와 데이터를 주고 받을 수 있다.In the case of implementation by firmware or software, an embodiment of the present invention may be implemented in the form of a module, procedure, function, etc. that perform the functions or operations described above. The software code may be stored in the memory and driven by the control unit. The memory may be located inside or outside the user terminal and the server, and data may be exchanged with the controller by various known means.
본 발명의 실시 예에 따른 상기 제어부 130는 이미지 데이터의 해상도를 인공 신경망 기반의 연산을 통해 개선하기 위해 요구되는 파일인 범용 신경망 파일을 생성할 수 있다.The controller 130 according to an embodiment of the present invention may generate a general-purpose neural network file, which is a file required to improve the resolution of image data through an artificial neural network-based operation.
상기 제어부 130는 자료 가공부 131, 신경망 학습부 132, 결과 평가부 133, 사용패턴 산출부 134를 포함하여 구성될 수 있다.The controller 130 may include a data processing unit 131 , a neural network learning unit 132 , a result evaluation unit 133 , and a usage pattern calculating unit 134 .
먼저 상기 자료 가공부 131는 비디오 데이터의 화질 개선을 위해 요구되는 범용 신경망 파일을 산출하기 위해 필요한 학습용 자료를 수집 및 가공할 수 있다. 상기 자료 가공부 131는 수집된 자료의 1차 변경(축소 변경) 및 2차 변경(축소된 이미지 데이터를 다시 확대)을 수행할 수 있다. 상기 자료 가공부 131가 수행하는 동작의 보다 구체적인 내용은 를 참조하여 기술하기로 한다. First, the data processing unit 131 may collect and process learning data required to calculate a general-purpose neural network file required for image quality improvement of video data. The data processing unit 131 may perform a primary change (reduction change) and a secondary change (enlargement of the reduced image data again) of the collected data. More specific details of the operation performed by the data processing unit 131 will be described with reference to .
상기 신경망 학습부 132는 상기 자료 가공부 131에서 수행한 자료의 수집 및 가공 동작을 거친 후 산출된 가공된 데이터를 기반으로 인공지능에 기반한 신경망 학습 동작을 진행할 수 있다. 상기 신경망 학습부 132는 학습 과정에 요구되는 파라미터 설정 동작 및 신경망 파일 산출 동작을 수행할 수 있다. 상기 신경망 학습부 132에 대한 보다 자세한 설명은 를 참조하여 기술하기로 한다.The neural network learning unit 132 may perform a neural network learning operation based on artificial intelligence based on the processed data calculated after the data collection and processing operations performed by the data processing unit 131 are performed. The neural network learning unit 132 may perform a parameter setting operation and a neural network file calculation operation required for a learning process. A more detailed description of the neural network learning unit 132 will be described with reference to .
상기 결과 평가부 133는 신경망 학습부 132를 통해 산출된 범용 신경망 파일을 사용자 기기 200에서 적용한 결과값을 평가하는 동작을 수행할 수 있다.The result evaluation unit 133 may perform an operation of evaluating a result value obtained by applying the general-purpose neural network file calculated by the neural network learning unit 132 in the
구체적으로, 상기 결과 평가부 133는 사용자 기기 200에서 신경망 파일을 적용한 결과 데이터의 해상도의 향상 정도를 판단할 수 있다. 또한 상기 결과 평가부 133는 신경망 파일을 적용한 결과 데이터와 원본 데이터와의 오차율을 판단할 수 있다. 이 때 결과 데이터와 원본 데이터의 비교 단위는 영상을 구성하는 각 프레임일 수도 있고, 영상의 전송을 위해 분할된 조각 단위일 수도 있다.Specifically, the result evaluator 133 may determine the degree of improvement in the resolution of data as a result of applying the neural network file in the
또는 다양한 실시 예에 따라 각 영상 데이터는 이미지 동일성에 기반하여 다수개의 프레임 묶음(예, 일 이미지가 100프레임에 걸쳐 표시되는 경우, 상기 100프레임은 하나의 프레임 묶음으로 설정될 수 있고, 이러한 프레임 묶음 또한 다수 개로 설정될 수 있음)으로 분할되어 있을 수 있다. 이에 따라 상기 결과 데이터와 원본 데이터의 비교 단위는 이미지 동일성에 기반하여 분할된 묶음 단위가 될 수 있다.Alternatively, according to various embodiments, each image data is a plurality of frame bundles based on image identity (eg, when an image is displayed over 100 frames, the 100 frames may be set as one frame bundle, and such a frame bundle In addition, it may be divided into a plurality of pieces). Accordingly, the comparison unit of the result data and the original data may be a bundle unit divided based on image identity.
나아가 상기 결과 평가부 133는 상기 결과 데이터와 상기 원본 데이터와의 오차율이 기준값 이상인 것으로 판단되는 경우 신경망 파일을 구성하는 Weight, bias 값 등의 수정을 요청할 수 있다. 즉, 상기 결과 평가부 133는 원본 데이터와 결과 데이터의 비교를 통해 신경망 파일을 구성하는 파라미터의 수정 여부를 판단할 수 있다.Furthermore, when it is determined that the error rate between the result data and the original data is equal to or greater than a reference value, the result evaluator 133 may request correction of weight and bias values constituting the neural network file. That is, the result evaluator 133 may determine whether to modify the parameters constituting the neural network file by comparing the original data and the result data.
일 실시 예에 따라 상기 결과 평가부 133는 원본 데이터로부터 영상을 이해하기 위해 요구되는 이미지 객체별 중요도를 산출할 수 있다. 그리고 상기 원본 데이터와 상기 결과 데이터(사용자 기기 200에서 신경망 파일을 적용하여 해상도를 개선한 데이터)의 1단위(예, 1프레임, 1 프레임 묶음 등) 오차율이 기 설정된 값 이상임과 동시에 상기 1단위에 기 설정된 값 이상인 이미지 객체가 포함된 것으로 판단된 경우, 신경망 파일을 구성하는 weight, bias 값의 수정을 요청할 수 있다.According to an embodiment, the result evaluator 133 may calculate the importance of each image object required to understand the image from the original data. And, the error rate of one unit (eg, one frame, one frame bundle, etc.) of the original data and the result data (data whose resolution is improved by applying a neural network file in the user device 200) is equal to or greater than a preset value, and When it is determined that an image object greater than or equal to a preset value is included, it is possible to request correction of weight and bias values constituting the neural network file.
상기 이미지 객체별 중요도는 1 프레임 내 1 이미지 객체가 차지하는 사이즈 비율, 이미지 객체의 반복 비율 등에 기반하여 그 값이 산출될 수 있다.The importance of each image object may be calculated based on a size ratio occupied by one image object in one frame, a repetition ratio of the image object, and the like.
다양한 실시 예에 따라, 상기 결과 평가부 133는 다양한 실시 예에 따라 비디오 데이터의 콘텐츠 특성에 기반한 이미지 객체별 중요도를 산출할 수 있다. 상기 결과 평가부 133는 먼저 비디오 데이터의 콘텐츠 특성을 확인할 수 있는데, 이 때 사익 비디오 데이터의 콘텐츠 특성은 상기 자료 가공부 131에 의해 산출될 수 있다. 예컨대, 상기 비디오 데이터의 콘텐츠 특성은 비디오 데이터가 서버 100로 파일이 업로드된 경로에 대한 정보(예, 사용자 또는 관리자가 해당 비디오 파일을 서버 100로 업로드할 당시 선택한 폴더 명), 사용자 또는 관리자가 해당 비디오 파일을 서버 100에 업로드할 당시 입력한 콘텐츠 장르, 분야 등에 기반하여 산출될 수 있다. 그리고 산출된 비디오 데이터의 콘텐츠 특성은 해당 비디오 데이터의 메타 데이터로 관리될 수 있다.According to various embodiments, the result evaluator 133 may calculate the importance of each image object based on content characteristics of video data according to various embodiments. The result evaluator 133 may first check the content characteristics of the video data. In this case, the content characteristics of the private video data may be calculated by the data processing unit 131 . For example, the content characteristics of the video data include information on the path where the video data is uploaded to the server 100 (eg, the folder name selected by the user or administrator when uploading the video file to the server 100), and the user or administrator It may be calculated based on the content genre, field, etc. input at the time of uploading the video file to the
이에 따라 상기 결과 평가부 133는 서버 100로 업로드 될 당시 추출되고 저장된 각 비디오 데이터의 콘텐츠 특성 정보를 확인할 수 있으며, 그에 따라 콘텐츠 특성 정보에 기반한 이미지 객체별 중요도를 산출할 수 있다. 예컨대, 상기 결과 평가부 133는 인물의 안면 객체, 텍스트 객체(예, 자막), 사물 객체 등으로 이미지 객체의 항목을 분류할 수 있고, 콘텐츠 특성 정보와 매칭되는 각 객체 항목(예, 드라마 콘텐츠에 대응하여 인물의 안면 객체를 매칭할 수 있음)을 판단할 수 있다.Accordingly, the result evaluator 133 may check the content characteristic information of each video data extracted and stored at the time of being uploaded to the
상기 사용 패턴 산출부 134는 사용자의 스트리밍 요청 기록, 다운로드 기록, 사용자 기기 200로부터 산출되어 전송되는 사용자 정보 등에 기반하여 사용자의 VOD 서비스에 대한 사용 패턴을 산출할 수 있다. The usage pattern calculating unit 134 may calculate the user's usage pattern for the VOD service based on the user's streaming request record, download record, and user information calculated and transmitted from the
사용 패턴 산출부 134는 사용 패턴으로 사용자의 선호 장르, 선호 컨텐츠 특성, 주요 스트리밍 요청 시간대, 주요 시청 기기 등과 같은 항목을 산출할 수 있다. 상기 사용 패턴 산출부 134는 산출된 사용자의 사용 패턴 정보에 기반하여 사용자에게 적합한 화면 모드를 추천할 수 있다. 다양한 실시 예에 따라 화질 개선을 위한 신경망 파일은 범용으로 사용될 수 있으나 결과 데이터의 화면 모드(예, 영화 사이즈 모드, 자막 위주 모드, 특정 색상(RGB) 강화 모드, 인물 위주 해상도 개선 모드 등)에 따라 구분된 파일로 산출될 수도 있다. 즉, 사용자는 사용자 기기 200로 서버 100에서 제공 가능한 다수개의 화면 모드별 신경망 파일들 중 자신의 사용 패턴에 적합한 1개의 범용 신경망 파일을 다운로드하여 해상도 개선을 수행할 수 있다. 이를 위해 상기 사용 패턴 산출부 134는 사용자별 사용 패턴을 산출하고, 그에 대한 정보를 별도로 관리할 수 있다. 이후 해당 사용자가 스트리밍 요청할 경우, 해당 사용자의 사용 패턴에 적합한 모드의 신경망 파일을 생성하고 이를 제공할 수 있다.The usage pattern calculating unit 134 may calculate items such as a user's preferred genre, preferred content characteristics, main streaming request time period, and main viewing device as a usage pattern. The usage pattern calculator 134 may recommend a screen mode suitable for the user based on the calculated user's usage pattern information. According to various embodiments, the neural network file for image quality improvement may be used for general purpose, but depending on the screen mode of the result data (eg, movie size mode, subtitle-oriented mode, specific color (RGB) enhancement mode, person-oriented resolution improvement mode, etc.) It may be produced as a separate file. That is, the user may perform resolution improvement by downloading one general-purpose neural network file suitable for his/her usage pattern among a plurality of neural network files for each screen mode provided by the
다양한 실시 예에 따라 사용자의 사용 패턴에 적합한 범용 신경망 파일은 서버 100의 사용 패턴 산출부 134에서 산출한 사용자의 사용 패턴 정보에 기반하여 자동으로 설정될 수도 있고, 사용자에 의해 선택된 화면 모드에 기반하여 설정될 수도 있다.According to various embodiments, a general-purpose neural network file suitable for a user's usage pattern may be automatically set based on the user's usage pattern information calculated by the usage pattern calculating unit 134 of the
본 발명의 실시 예에 따른 상기 자료 가공부 131는 에서 도시되는 바와 같이, 사이즈 변경부 131a, 영상 분할부 131b, 특징 영역 추출부 131c를 포함하여 구성될 수 있다.As shown in , the data processing unit 131 according to an embodiment of the present invention may include a size change unit 131a, an image division unit 131b, and a feature region extraction unit 131c.
비디오 데이터의 화질 개선을 위한 신경망 파일을 산출하기 위해서는 신경망 학습부에 인풋 레이어에 투입할 입력 자료 내지는 입력할 자료의 특징값 등이 준비되어야 하는데, 상기 자료 가공부 131에서 인풋 레이어에 투입할 자료 및 데이터를 준비할 수 있다.In order to calculate a neural network file for improving the quality of video data, input data to be input to the input layer or feature values of the data to be input must be prepared in the neural network learning unit. data can be prepared.
먼저, 상기 사이즈 변경부 131a는 비디오 데이터를 구성하는 이미지의 사이즈를 원본 사이즈로부터 기 설정된 값만큼 축소시키는 1차 변경 동작과 1차 변경 결과 이미지를 원본 사이즈에 대응하여 확대시키는 2차 변경 동작을 수행할 수 있다.First, the size change unit 131a performs a primary change operation for reducing the size of an image constituting video data by a preset value from the original size and a secondary change operation for enlarging the image as a result of the primary change to correspond to the original size. can do.
사이즈 변경부 131a는 원본 이미지 605를 소정의 비율로 축소하는 1차 변경 동작인 a동작을 수행할 수 있으며, a동작 결과 산출된 축소 이미지 610를 원본 이미지와 동일한 사이즈로 확대하는 2차 변경동작인 b동작을 수행할 수 있다. 가공 동작(1차 변경 동작(a) 및 2차 변경 동작(b)) 이후 생성된 이미지 615는 원본 이미지 605와 달리 해상도가 낮아지게 되며, 이는 이미지를 구성하는 픽셀이 수치의 증가 없이 사이즈만 확대된 것에 기인한다.The size changer 131a may perform an operation a, which is a first change operation for reducing the original image 605 at a predetermined ratio, and a secondary change operation for enlarging the reduced image 610 calculated as a result of operation a to the same size as the original image. action b can be performed. Unlike the original image 605, the image 615 generated after the processing operation (the first change operation (a) and the second change operation (b)) has a lower resolution. due to being
이미지 615(이미지 610와 동일한 해상도)와 원본 이미지 605를 비교해 볼 때, 상기 이미지 615는 픽셀의 사이즈가 증가되었으며, 그에 따라 모자이크 형태의 격자가 생성된 모습을 보임을 알 수 있다.When the image 615 (the same resolution as the image 610) is compared with the original image 605, it can be seen that the pixel size of the image 615 is increased, and accordingly, a mosaic-type grid is generated.
본 발명의 실시 예에 따른 서버 100는 저화질인 이미지 615로부터 원본 이미지 605로 해상도 수준을 변환하기 가공 이미지 615와 원본 이미지 605를 기반으로 신경망 학습을 수행할 수 있다. 이를 위해 상기 자료 가공부 131의 사이즈 변경부 131a는 원본 이미지의 사이즈를 기 설정된 값만큼 축소하는 1차 변경 동작과 1차 변경 동작에 의해 생성된 축소 이미지를 원본 이미지와 동일한 사이즈로 확대하는 2차 변경 동작을 수행할 수 있다. 아울러, 상기 자료 가공부 131는 원본 이미지와, 1차 변경 동작 및 2차 변경 동작에 의해 생성된 가공 이미지를 학습용 데이터로 추출하는 동작을 수행할 수 있다.The
다양한 실시 예에 따라 신경망 학습 수행 전, 상기 자료 가공부 131는 가공 이미지(사이즈 축소 후 확대한 이미지)에 생성된 격자의 패턴 정보(위치 정보, 색상 정보 등)을 추출하고 이에 대한 데이터를 신경망 학습을 위한 인풋 데이터로 활용할 수 있다.According to various embodiments, before performing neural network learning, the data processing unit 131 extracts pattern information (position information, color information, etc.) of a grid generated in a processed image (image that is enlarged after size reduction), and uses the data for neural network learning. It can be used as input data for
상기 영상 분할부 131b는 서버 100에서 보유하고 있는 비디오 데이터들을 기 설정된 조건에 기반하여 분할하는 동작을 수행할 수 있다. 이 때 상기 영상 분할부 131b는 비디오 데이터를 프레임 수에 기초하여 분할하는 동작을 수행할 수 있다. 또는 상기 영상 분할부 131b는 비디오 데이터를 이미지 객체의 일치율에 기반하여, 일치율이 기 설정된 이상인 프레임들끼리 묶어 묶음(청크;Chunk)으로 분할할 수 있다. 예컨대, 분할 단위는 동일 인물이 촬영된 또한 상기 영상 분할부 131b는 서버 100에서 사용자 기기 200로 스트리밍 서비스를 제공할 시 사용자 기기 200로 전달되는 단위별로 비디오 데이터를 다수개의 청크로 분할할 수 있다.The image dividing unit 131b may perform an operation of dividing the video data held by the
상기 영상 분할부 131b에서 분할된 청크들은 인공지능 신경망 학습 및 해상도 향상 결과를 평가할 시 활용될 수 있다.The chunks divided by the image dividing unit 131b may be utilized when evaluating the results of learning the artificial intelligence neural network and improving the resolution.
상기 특징영역 추출부 131c는 비디오 데이터의 각 프레임 또는 분할 단위를 기준으로 특징 이미지가 포함된 특징 영역을 추출하는 동작을 수행할 수 있다. 상기특징영역 추출부 131c는 각 프레임 또는 분할 단위에서 기 설정된 특징 영역 요건을 갖추는 이미지 영역의 존재 여부를 판단할 수 있다. 상기 특징 영역 요건은 예컨대, 중요도가 기 설정된 값 이상인 것으로 판단되는 이미지 객체가 존재하는 영역을 포함할 수 있다. 예를 들면, 상기 특징 영역 추출부 131c는 드라마 콘텐츠에서 주인공의 얼굴 이미지에 대하여 이미지 객체 중요도를 높게 설정할 수 있으며, 그에 따라 특징 영역은 주인공의 얼굴 이미지가 표시되는 영역(예, 누끼 영역; 배경과 구분되는 객체 표시 영역)으로 설정될 수 있다.The feature region extractor 131c may perform an operation of extracting a feature region including a feature image based on each frame or division unit of video data. The feature region extractor 131c may determine whether there is an image region having a preset feature region requirement in each frame or division unit. The feature area requirement may include, for example, an area in which an image object whose importance is determined to be greater than or equal to a preset value. For example, the feature region extractor 131c may set the image object importance to the face image of the main character in the drama content to be high, and accordingly, the feature region may be an area in which the face image of the main character is displayed (eg, nuisance region; background and separate object display area).
상기 특징영역 추출부 131c는 이미지 내 특징 영역 뿐 아니라, 비디오 데이터의 전체 프레임 내지 이미지들 중 특정 프레임, 또는 특정 분할 단위를 추출하는 동작을 수행할 수도 있다.The feature region extractor 131c may perform an operation of extracting not only the feature region in the image, but also a specific frame or a specific division unit among all frames or images of video data.
이러한 특징 영역 추출부 131c에서 추출하는 특징 영역에 대하여는 학습 반복 횟수를 증가시키도록 학습 중요도 가중치를 설정할 수 있다.With respect to the feature region extracted by the feature region extractor 131c, a learning importance weight may be set to increase the number of learning repetitions.
본 발명의 실시 예에 따른 신경망 학습부 132는 에서 도시되는 바와 같이, 파라미터 설정부 132a, 신경망 파일 산출부 132b를 포함하여 구성될 수 있다.As shown in , the neural network learning unit 132 according to an embodiment of the present invention may be configured to include a parameter setting unit 132a and a neural network file calculating unit 132b.
그리고 상기 신경망 학습부 132는 인공신경망을 기반으로 한 딥러닝 학습 과정을 수행할 수 있고 그에 따라 해상도가 낮은 비디오 데이터의 화질 개선을 위해 요구되는 파일인 신경망 파일을 생성할 수 있다.In addition, the neural network learning unit 132 may perform a deep learning learning process based on an artificial neural network, and thus may generate a neural network file, which is a file required for image quality improvement of low-resolution video data.
인풋 레이어, 히든 레이어, 아웃풋 레이어를 포함하는 신경망 모델인 퍼셉트론이 개시되고 있다. 일 실시 예에 따라 본 발명에서 개시되는 신경망 학습은 적어도 하나의 히든 레이어를 포함하도록 구현된 멀티레이어 퍼셉트론을 이용하여 수행될 수 있다. 기본적으로, 퍼셉트론은 다수의 신호를 입력(input)받아서 하나의 신호를 출력(output)할 수 있다.A perceptron, a neural network model including an input layer, a hidden layer, and an output layer, is disclosed. According to an embodiment, the neural network learning disclosed in the present invention may be performed using a multi-layer perceptron implemented to include at least one hidden layer. Basically, the perceptron may receive a plurality of signals as input and output one signal.
인공신경망 모델을 이용한 연산 과정에서 요구되는 weight와 bias는 역전파 기법을 통해 적정 값으로 산출될 수 있다. 본 발명의 실시 예에 따른 인공신경망 학습 과정은 이러한 역전파 기법을 통해 적정 weight 데이터와 bias 데이터를 추출하게 된다. 본원 발명에서 해상도 개선을 수행하기 위해 인공신경망을 통해 산출하는 신경망 파일은 추출된 적정 weight 데이터와 bias 데이터에 관한 정보 등을 포함할 수 있다.The weights and biases required in the calculation process using the artificial neural network model can be calculated as appropriate values through the backpropagation technique. The artificial neural network learning process according to an embodiment of the present invention extracts appropriate weight data and bias data through this backpropagation technique. In the present invention, a neural network file calculated through an artificial neural network in order to improve resolution may include information about extracted appropriate weight data and bias data, and the like.
역전파 기법을 통해 수행되는 인공신경망을 통한 학습방법 및 파라미터 수정에 관하여는 공지된 기술이므로 자세한 설명은 생략하기로 한다.Since the learning method and parameter modification through the artificial neural network performed through the backpropagation technique are known techniques, a detailed description thereof will be omitted.
바람직하게는, 본 발명의 실시 예에 따른 신경망 학습부 132는 인공신경망 모델 중 CNN(Convolution Neural Network)모델을 이용하여 학습을 수행할 수 있다. CNN의 경우 각 레이어의 입출력 데이터의 형상을 유지한다는 점, 이미지의 공간 정보를 유지하면서 인접 이미지와의 특징을 효과적으로 인식하는 점, 복수의 필터로 이미지의 특징 추출 및 학습하는 점 등의 특징이 있다.Preferably, the neural network learning unit 132 according to an embodiment of the present invention may perform learning using a Convolution Neural Network (CNN) model among artificial neural network models. In the case of CNN, there are features such as maintaining the shape of input/output data of each layer, effectively recognizing features with adjacent images while maintaining spatial information of the image, and extracting and learning features of images with multiple filters. .
기본적인 CNN의 동작 방식은 하나의 이미지를 필터(filter)를 통해 일부분의 영역을 하나씩 스캔하여 그것에 대한 값을 찾아내면서 학습시키는 방법을 사용할 수 있다. 이 때 적절한 Weight값을 갖는 필터를 찾는 것이 CNN의 목표가 된다. CNN에서 필터는 일반적으로 (4,4)나 (3,3)과 같은 정사각 행렬로 정의될 수 있다. 본 발명의 실시 예에 따른 CNN용 필터의 설정값은 제한되지 않는다. 상기 필터는 입력 데이터를 지정된 간격으로 순회하면서 합성곱을 계산할 수 있다.The basic operation method of CNN is to scan a part of an image through a filter one by one and learn it while finding a value for it. At this time, the goal of CNN is to find a filter with an appropriate weight value. In CNN, a filter can be defined as a square matrix such as (4,4) or (3,3). The set value of the filter for CNN according to an embodiment of the present invention is not limited. The filter may calculate the convolution while traversing the input data at a specified interval.
본 발명의 실시 예에 따른 파라미터 설정부 132a는 이러한 CNN을 통해 영상 데이터에 대한 학습 과정을 수행하기 위한 초기 파라미터 값을 설정할 수 있다.The parameter setting unit 132a according to an embodiment of the present invention may set initial parameter values for performing a learning process on image data through the CNN.
다양한 실시 예에 따라 상기 파라미터 설정부 132a는 원본 데이터의 프레임 사이즈, 가공 데이터 생성 시 원본 데이터에 설정된 축소 비율 등을 판단하고, 이에대응하는 초기 파라미터를 설정할 수 있다.According to various embodiments of the present disclosure, the parameter setting unit 132a may determine a frame size of the original data, a reduction ratio set in the original data when generating the processed data, etc., and set an initial parameter corresponding thereto.
또한 다양한 실시 예에 따라 상기 파라미터 설정부 132a는 인공 신경망 학습을 위해 요구되는 이미지 데이터의 종류를 특정하고, 해당 이미지 데이터를 학습 데이터로 투입하도록 요청할 수 있다. 예컨대, 상기 파라미터 설정부 132a는 장르별 학습 중요도 가중치가 설정되었는지 여부를 판단할 수 있고, 해당 학습 동작이 완료되기 전 학습 중요도 가중치가 설정된 이미지를 추가로 요청할 수 있다. 구체적으로, 상기 파라미터 설정부 132a는 드라마, 영화 등의 인물 비중이 높은 콘텐츠의 경우, 주요 인물에 대하여 반복 학습을 수행하기 위해 추가로 관련 이미지 객체가 포함된 프레임 정보를 학습 데이터로써 요청할 수 있다.Also, according to various embodiments, the parameter setting unit 132a may specify a type of image data required for artificial neural network learning, and may request to input the image data as training data. For example, the parameter setting unit 132a may determine whether a learning importance weight for each genre is set, and may additionally request an image with a learning importance weight set before the corresponding learning operation is completed. Specifically, in the case of content having a high proportion of characters, such as a drama or a movie, the parameter setting unit 132a may additionally request frame information including a related image object as learning data in order to repeatedly learn the main character.
상기 신경망 파일 산출부 132b는 기 설정된 인공신경망 모델에 자료 가공부 131에 의해 가공된 자료를 투입하여 학습시키는 동작을 수행할 수 있다. 이 때 상기 신경망 파일 산출부 132b는 원본 데이터와 가공(기 설정된 비율로 축소) 데이터를 CNN 알고리즘에 투입하여 원본데이터에서 가공데이터로 변경되는 과정에서 생성된 격자에 대한 정보(격자 생성 패턴 정보)를 추출할 수 있다. 보다 구체적으로, 상기 신경망 파일 산출부 132b에서 산출하는 격자 생성 패턴 정보는 원본 데이터와 가공 데이터의 차이점에 기반하여 산출될 수 있으며, 격자의 위치, 격자의 색상 변화에 대한 패턴정보 등을 포함할 수 있다.The neural network file calculating unit 132b may perform an operation of learning by inputting the data processed by the data processing unit 131 into a preset artificial neural network model. At this time, the neural network file calculation unit 132b inputs the original data and the processed (reduced to a preset ratio) data to the CNN algorithm and information about the grid (lattice generation pattern information) generated in the process of changing from the original data to the processed data. can be extracted. More specifically, the grid generation pattern information calculated by the neural network file calculating unit 132b may be calculated based on the difference between the original data and the processed data, and may include pattern information on the location of the grid and the color change of the grid. have.
상기 신경망 파일 산출부 132b는 상기 산출된 격자 생성 패턴 정보를 기반으로 가공데이터에서 격자를 소거하여 원본 데이터로 이미지를 복원시키는 데 요구되는 신경망 파일을 생성할 수 있다. 상기 신경망 파일 산출부 132b는 저화질 비디오(가공 데이터)데이터를 인공신경망 알고리즘에 인풋 데이터로 입력하여 연산을 수행한 결과 출력되는 데이터의 해상도가 원본 데이터와 기 설정된 값 이상의 일치율을 보이는 경우에 1 데이터의 학습 과정을 종료할 수 있다. 이와 유사한 방법으로 상기 신경망 파일 산출부 132b는 무수히 다양한 종류의 가공데이터를 인풋 레이어에 입력하고 인공 신경망 연산 결과 원본데이터와의 일치율을 판단하는 동작을 반복적으로 수행할 수 있다.The neural network file calculator 132b may generate a neural network file required to restore an image to the original data by erasing the grid from the processed data based on the calculated grid generation pattern information. The neural network file calculating unit 132b inputs low-quality video (processed data) data to the artificial neural network algorithm as input data, and as a result of performing the calculation, the resolution of the output data shows a matching rate greater than or equal to a preset value with the original data. You can end the learning process. In a similar way, the neural network file calculator 132b may repeatedly perform an operation of inputting countless different types of processed data into an input layer and determining a matching rate with the original data as a result of artificial neural network computation.
다양한 실시 예에 따라 상기 신경망 파일 산출부 132b는 다양한 종류의 원본 데이터와 가공 데이터를 투입하여 특정 사이즈의 이미지를 축소하는 경우 발생되는 격자 생성 패턴 정보를 산출할 수 있다. 이에 따라 상기 신경망 파일 산출부 132b는 특정 이미지에서 뿐 아니라, 다양한 이미지들에서 이미지 축소 시 공통적으로 발생되는 격자 생성 패턴 정보를 산출할 수 있다.According to various embodiments, the neural network file calculator 132b may calculate grid generation pattern information generated when an image of a specific size is reduced by inputting various types of original data and processed data. Accordingly, the neural network file calculator 132b may calculate grid generation pattern information that is commonly generated when reducing images in various images as well as in a specific image.
상기 신경망 파일 산출부 132b는 가공 데이터를 인풋 레이어로 투입하고 아웃풋 데이터와 원본 데이터와의 일치율이 기 설정된 값 이상인 경우에, 해당 인공신경망 알고리즘에 설정된 파라미터들(weight, bias, 학습 속도(learning rate) 등)및 레이어별 활성화 함수 등의 정보를 포함하여 신경망 파일을 생성할 수 있다.The neural network file calculator 132b inputs the processed data to the input layer and when the matching rate between the output data and the original data is equal to or greater than a preset value, parameters (weight, bias, learning rate) set in the corresponding artificial neural network algorithm etc.) and information such as an activation function for each layer, a neural network file can be created.
즉, 상기 신경망 파일 산출부 132b에서 산출되는 신경망 파일을 사용자 기기 200에 전달하면, 사용자 기기 200는 이를 수신하여 저화질의 비디오 데이터를 상기 신경망 파일에 기반한 정보를 토대로 인공 신경망 테스트를 수행할 수 있고 그에 따라 비디오 데이터의 해상도 개선 기능을 수행할 수 있다.That is, when the neural network file calculated by the neural network file calculating unit 132b is transmitted to the
본 발명의 실시 예에 따른 사용자 기기 200는 통신부 210, 저장부 220, 입력부 230, 표시부 240, 카메라부 250 및 제어부 260를 포함하여 구성될 수 있다. 그리고 상기 제어부 260는 비디오 재생부 261, 해상도 변환부 262, 사용자 정보 수집부 263를 포함하여 구성될 수 있다.The
본 발명의 실시 예에 따른 상기 통신부 210는 서버100로부터 신경망 파일 및 비디오 데이터를 수신하기 위한 통신 기능을 수행할 수 있다. 나아가 상기 통신부 210는 사용자 기기 200에서 수집된 피드백 정보를 서버 100로 전송하기 위한 통신 동작을 수행할 수 있다.The communication unit 210 according to an embodiment of the present invention may perform a communication function for receiving a neural network file and video data from the
상기 저장부 220는 본 발명의 실시 예에 따라 상기 서버 100로부터 수신된 신경망 파일 및 비디오 데이터를 저장할 수 있다. 다양한 실시 예예 따라 상기 저장부 220는 기 설정된 기준치 이하의 해상도를 갖는 저화질 데이터에 신경망 파일을 적용하여 인공신경망 알고리즘 연산을 구동한 결과값인 결과 데이터(해상도가 개선된 데이터)를 저장 또는 임시 저장할 수 있다.The storage 220 may store the neural network file and video data received from the
상기 저장부 220는 생성된 피드백 정보를 저장할 수 있다. 또는 상기 저장부 220는 피드백 정보를 산출하는데 요구되는 정보를 저장할 수 있다. 예컨대, 인공신경망 알고리즘의 연산 결과로 생성된 결과 데이터(해상도 개선된 데이터)들 중 피드백 정보로 제공하기 위해 일 프레임을 추출하는 경우, 상기 추출에 대한 기준 정보(예, 동영상 재생 중 감지되는 사용자의 안면의 찡그림 여부 및 안면의 찡그림이 감지되는 시점의 프레임을 추출하는 내용 등)를 저장할 수 있다.The storage unit 220 may store the generated feedback information. Alternatively, the storage 220 may store information required to calculate the feedback information. For example, when extracting one frame to provide feedback information from result data (resolution-improved data) generated as a result of the computation of an artificial neural network algorithm, reference information for the extraction (for example, the user's content of extracting a frame at a point in time when facial distortion is detected and whether facial distortion is detected) may be stored.
상기 입력부 230는 콘텐츠 장르, 콘텐츠 명칭 등에 관한 사용자 선택 정보를 입력받을 수 있다.The input unit 230 may receive user selection information regarding a content genre, a content name, and the like.
상기 표시부 240는 서버 100로부터 수신된 비디오 데이터 또는 상기 비디오 데이터의 해상도 개선 동작 이후의 결과 데이터가 재생될 시 해당 비디오의 재생 화면을 표시할 수 있다.When the video data received from the
상기 카메라부 250는 사용자 요청에 대응하여 사진 및 동영상을 촬영할 수 있다. 상기 카메라부 250는 촬영된 사진 및 동영상 등의 이미지 정보는 상기 서버 100 또는 기타 웹 서버로 업로드될 수 있다. 또는 상기 카메라부 250를 통해 촬영된 이미지 정보는 타 사용자 기기로 전송될 수 있다.The camera unit 250 may take pictures and videos in response to a user request. The camera unit 250 may upload image information such as a photographed picture and a video to the
상기 카메라부 250는 사진 또는 동영상 등의 이미지 정보를 촬영할 경우 먼저 사용자 요청에 기반하여 해상도를 결정할 수 있다. 일 실시 예에 따라, 상기 카메라부 250는 화질 개선을 위한 범용 신경망파일의 탑재 유무에 기반하여, 촬영되는 사진 또는 동영상등의 해상도를 기 설정된 수준이하로 낮춰 저장하도록 할 수 있다.The camera unit 250 may first determine a resolution based on a user request when capturing image information such as a photo or a video. According to an embodiment, the camera unit 250 may lower the resolution of a photographed photo or video to a preset level or less and store it based on whether or not a general-purpose neural network file for image quality improvement is mounted.
다양한 실시 예에 따라 상기 카메라부 250는 해상도가 개선된 결과 데이터를 재생하는 중 기 설정된 기준 간격에 따라 정기적으로 사용자의 안면을 촬영하는 카메라를 동작시킬 수 있다. 사용자의 안면 표정 내지는 미간의 찡그림 여부를 판단할 수 있으며, 그에 대응하여 피드백 정보를 추출할 수 있다.According to various embodiments of the present disclosure, the camera unit 250 may operate a camera that periodically captures the user's face according to a preset reference interval while reproducing the result data with improved resolution. It is possible to determine whether the user's facial expression or the frown of the forehead is wrinkled, and feedback information can be extracted in response thereto.
상기 제어부 260는 서버 100로부터 다운로드되는 비디오 파일의 해상도 변환 및 재생을 수행할 수 있다. 상기 제어부 260는 구체적으로, 비디오 재생부 261, 해상도 변환부 262, 사용자 정보 수집부 263을 포함하여 구성될 수 있다.The controller 260 may perform resolution conversion and reproduction of a video file downloaded from the
먼저, 본 발명의 실시 예에 따른 상기 비디오 재생부 261는 비디오 파일을 플레이하여 상기 표시부 240에 표시하도록 제어할 수 있다. 상기 비디오 재생부 261는 출력 요청된 비디오 데이터의 해상도를 판단할 수 있다. 상기 비디오 재생부 261는 실행 요청된 비디오 데이터의 해상도가 기 설정된 수준 이하의 해상도 개선이 요구되는 상태로 판단되는 경우, 해상도 변환부 262에 해상도 개선을 요청할 수 있다. 이후 상기 비디오 재생부 261는 상기 해상도 변환부 262를 통해 해상도가 개선된 파일을 재생할 수 있다.First, the video playback unit 261 according to an embodiment of the present invention may play a video file and control it to be displayed on the display unit 240 . The video player 261 may determine the resolution of the video data requested to be output. When it is determined that the resolution of the video data requested to be executed is in a state in which resolution improvement below a preset level is required, the video playback unit 261 may request the resolution conversion unit 262 to improve the resolution. Thereafter, the video reproducing unit 261 may reproduce a file whose resolution is improved through the resolution converting unit 262 .
상기 해상도 변환부 262는 현재 이미지 데이터(사진 및 동영상)의 해상도 수준과 사용자가 요청하는 목표 해상도의 수준을 판단할 수 있다. 이 때 상기 해상도 변환부 262는 신경망 파일의 기 보유 여부를 판단하고, 신경망 파일이 존재하지 않을 경우, 서버 100에 요청하여 상기 서버100로부터 범용 신경망 파일을 다운로드할 수 있다. 이후 상기 해상도 변환부 262는 상기 범용 신경망 파일에 기반하여 인공신경망 알고리즘을 구동하여 저화질 데이터를 원하는 수준의 해상도로 변환하는 동작을 수행할 수 있다.The resolution converter 262 may determine the resolution level of the current image data (photo and video) and the target resolution level requested by the user. At this time, the resolution converter 262 may determine whether the neural network file is pre-owned, and if the neural network file does not exist, it may request the
상기 사용자 정보 수집부 263는 피드백을 위해 사용자 정보를 수집할 수 있다. 상기 사용자 정보 수집부 263는 인공신경망 알고리즘에 기반하여 해상도 개선이 이루어진 이후의 결과 데이터 중 피드백 정보로 활용할 프레임을 선정하고 이를 저장할 수 있다. 예컨대, 상기 사용자 정보 수집부 263는 사용자가 해상도 개선이 이루어진 비디오 데이터를 재생하는 동안 사용자의 안면 정보를 획득할 수 있으며, 사용자의 미간 찌푸림 등의 이벤트가 발생된 경우, 상기 이벤트가 발생된 시점에 표시중인 비디오 프레임 정보를 수집할 수 있다.The user information collection unit 263 may collect user information for feedback. The user information collection unit 263 may select a frame to be used as feedback information among the result data after resolution is improved based on an artificial neural network algorithm and store it. For example, the user information collection unit 263 may acquire the user's facial information while the user reproduces the video data for which the resolution has been improved. Information on the video frame being displayed can be collected.
또한 상기 사용자 정보 수집부 263는 기준치 이상 재생되는 콘텐츠의 항목, 장르 등의 콘텐츠 정보를 수집할 수 있다. 예컨대, 상기 사용자 정보 수집부 263는 다큐멘터리(사진 이미지 기반) 대비 애니메이션의 재생 빈도, 자막이 존재하는 콘텐츠 대비 자막 없는 콘텐츠의 재생 빈도 등을 판단하고 이에 대한 정보를 수집할 수 있다. 상기 사용자 정보 수집부 263에서 수집된 재생 정보는 서버 100에 제공될 수 있으며, 서버 100에서는 이를 기반으로 사용자의 사용 패턴 정보를 산출할 수 있다.In addition, the user information collection unit 263 may collect content information such as items and genres of content reproduced above a reference value. For example, the user information collection unit 263 may determine the refresh rate of animation compared to documentary (based on photographic images), the refresh frequency of content without subtitles compared to content with subtitles, and the like, and collect information thereon. The reproduction information collected by the user information collection unit 263 may be provided to the
본 발명의 실시 예에 따른 서버 100는 해상도 개선을 위한 범용 신경망 파일을 생성하고 사용자 기기 200로 전송할 수 있다.The
구체적으로 살펴보면, 먼저, 상기 서버 100는 획득된 비디오 데이터를 가공하는 705동작을 수행할 수 있다. 상기 705동작은 인공 신경망 알고리즘에 학습시키기 위한 데이터를 생성하기 위한 동작이며, 학습용으로 적합한 데이터를 생성하기 위해 비디오 데이터의 이미지 사이즈를 축소하는 가공을 수행할 수 있다.Specifically, first, the
일 실시 예에 따라 상기 705동작은 비디오 파일을 구성하는 각 프레임별 가공 동작(사이즈 축소)일 수 있다. 또는 상기 705동작은 비디오 파일의 분할 단위별 샘플링을 통해 인공신경망 학습에 투입될 프레임을 선택한 후, 해당 프레임에 대하여 가공(기 설정된 비율을 곱하여 사이즈 축소)하는 동작일 수 있다. 예를 들어, 전체 프레임 수가 2400장인 비디오 파일의 경우 24개의 프레임이 한 단위인 청크가 100개로 구성되어 있다고 가정하면, 서버 100는 해당 비디오 분할 단위당 1프레임을 샘플링하여 총 100개의 프레임을 학습용 데이터로 가공할 수 있다.According to an embodiment, operation 705 may be a processing operation (size reduction) for each frame constituting a video file. Alternatively, operation 705 may be an operation of selecting a frame to be input to artificial neural network learning through sampling for each division unit of a video file, and then processing the frame (reducing the size by multiplying a preset ratio). For example, in the case of a video file with a total number of frames of 2400, assuming that 100 chunks of 24 frames are one unit, the
705동작 이후 상기 서버 100는 가공된 비디오 데이터 기반 격자 생성 패턴 정보를 획득하는 710동작을 수행할 수 있다. 상기 가공된 비디오 데이터는 원본 데이터(기 설정된 해상도 수준 이상인 데이터에 한하여 학습용 원본 데이터로 지정)를 기 설정된 비율로 사이즈를 축소시킨 데이터를 의미할 수 있다. After operation 705, the
일 이미지의 사이즈가 축소되면 동일 영역 내 표시될 픽셀의 수가 감소하게 되면서 자동적으로 해상도가 감소하게 된다. 이에 따라 이미지 사이즈를 축소시키게 되면 추후 다시 원본 이미지 사이즈로 확대하게 되더라도 감소된 해상도 수준을 유지하게 되기 때문에 격자 현상이 발생되게 된다.When the size of one image is reduced, the number of pixels to be displayed in the same area is reduced and the resolution is automatically reduced. Accordingly, if the image size is reduced, a lattice phenomenon occurs because the reduced resolution level is maintained even if the image size is enlarged to the original image size later.
서버 100는 이러한 격자 현상이 발생된 가공 이미지와 원본 이미지를 비교하여 격자가 발생되는 패턴 정보를 획득할 수 있다. 획득된 격자 발생 패턴 정보는 추후 격자 현상이 발생된 이미지에서 격자를 제거하여 해상도를 복원하기 위해 사용될 수 있다.The
격자 생성 패턴 정보를 획득하는 710동작 이후, 상기 서버 100는 격자 생성 패턴 정보에 기반하여 화질 개선용 신경망 파일을 생성하는 715동작을 수행할 수 있다. 상기 신경망 파일은 콘텐츠 종류에 관계없이 범용으로 적용 가능하도록 생성될 수 있는데, 이를 위해 다양한 종류의 이미지 및 콘텐츠를 활용하여 학습시킬 수 있다. 그리고 서버 100는 격자가 생성된 저화질 이미지 데이터에서 격자를 제거하여 원본 이미지로 복원하는 데 요구되는 인공신경망 알고리즘 정보(레이어별 적용된 활성화 함수, weight, bias 등)을 산출하여 신경망 파일을 생성할 수 있다.After operation 710 of obtaining the grid generation pattern information, the
결과값으로 제공되는 weight, bias 등의 요소는 최종 산출된 결과물(화질 개선된 데이터)과 원본 이미지 데이터의 일치율에 기반하여 결정될 수 있다. 상기 서버 100는 상기 일치율이 기 설정된 수준 이상인 경우 해당 인공신경망 연산 시 적용했던 weight와 bias 정보를 범용 신경망 파일에 포함시킬 정보로써 확정할 수 있다.Elements such as weight and bias provided as result values may be determined based on the matching rate between the final calculated result (image quality improved data) and the original image data. When the coincidence rate is equal to or greater than a preset level, the
이후 상기 서버 100는 사용자 기기 200로부터 비디오 데이터에 대한 스트리밍 요청(또는 다운로드 요청)이 수신됨을 확인하는 720동작을 수행할 수 있다. 사용자 요청에 대응하여 상기 서버 100는 사용자 기기 200에 생성된 화질 개선용 신경망 파일과 함께 요청된 비디오 데이터의 저화질 버전을 전송하는 725 동작을 수행할 수 있다. 이에 따라 사용자 기기 200는 비디오의 저화질 버전을 수신하므로 비교적 네트워크 환경에 의한 제약없이 수월하게 콘텐츠를 수신할 수 있으며, 함께 수신한 범용 신경망 파일을 상기 수신한 저화질 버전의 비디오 데이터에 적용함을 통해 사용자가 원하는 수준의 고화질 영상을 재생할 수 있게 된다.Thereafter, the
상기 도면에 도시되지는 않았지만, 다양한 실시 예에 따라 사용자 기기 200는 재생되거나 변환이 완료된 비디오 데이터의 상태에 대한 피드백 정보를 서버 100에 전송할 수 있다. 이에 따라 상기 사용자 기기 200는 기준치 이상의 빈도로 재생되는 콘텐츠 장르, 콘텐츠 특징, 주요 재생 요청 시간대 등의 사용자별 재생 관련 정보를 산출할 수 있으며, 이를 상기 서버 100로 전송할 수 있다.Although not shown in the drawing, according to various embodiments, the
나아가, 상기 사용자 기기 200는 해상도 개선 동작이 완료된 결과 데이터의 프레임 샘플을 서버 100로 기 설정된 주기에 따라 제공할 수 있다. 이에 따라 상기 서버 100는 사용자 기기 200로부터 수신되는 해상도 개선 동작 이후에 산출된 결과 데이터 프레임과 동일 콘텐츠의 원본 데이터 프레임을 비교할 수 있다. 전송되는 프레임 정보에는 콘텐츠에서의 재생 위치 정보가 함께 포함되어 전송될 수 있고, 그에 따라 상기 서버 100는 원본 데이터 내에서 비교할 프레임 이미지를 검색할 수 있다.Furthermore, the
상기 서버 100는 사용자 기기 200에서 피드백용으로 제공되는 이미지 프레임과 해당 콘텐츠의 원본 이미지 프레임을 비교하고, 일치율을 판단할 수 있다. 그리고 일치율이 기 설정된 기준치 이하인 것으로 판단되는 경우, 신경망 파일을 업데이트하기 위한 재학습 동작을 요청할 수 있으며, 그에 따라 재학습 동작을 수행할 수 있다.The
한편, 본 발명의 다양한 실시예에 따라 생성되는 신경망 파일은, 필요에 따라 압축될 수 있다. 일 실시예로, 서버 100는 사용자 기기 200의 성능을 고려하여 신경망 파일을 압축하고, 압축된 신경망 파일을 사용자 기기 200로 전송할 수 있다.Meanwhile, the neural network file generated according to various embodiments of the present invention may be compressed as necessary. As an embodiment, the
신경망 파일은, Pruning, Quantization, Decomposition 및 Knowledge Distillation 중 적어도 하나를 이용하여 압축될 수 있다. Pruning은 신경망 파일의 weight, bias 중 의미 없거나, 출력값에 큰 영향을 주지 않는 weight 및 bias를 삭제하는 압축 기법 중 하나이다. Quantization은 각각의 weight를 기 설정된 비트로 양자화 하는 압축 기법 중 하나이다. Decomposition은 weight의 집합인 가중치 행렬 또는 텐서(tensor)를 선형 분해(approximated decomposition)하여 weight의 크기를 줄이는 압축 기법 중 하나이다. Knowledge Distillation은 원본 모델을 Teacher 모델로 하여 원본 모델보다 작은 Student 모델을 생성하고 학습시키는 압축 기법 중 하나이다. 이때, Student 모델은 상술한 Pruning, Decomposition 또는 Quantization을 통해 생성될 수 있다.The neural network file may be compressed using at least one of Pruning, Quantization, Decomposition, and Knowledge Distillation. Pruning is one of the compression techniques that deletes weights and biases that are meaningless or do not significantly affect the output value among the weights and biases of the neural network file. Quantization is one of compression techniques that quantizes each weight into a preset bit. Decomposition is one of compression techniques for reducing the size of weights by linearly decomposing a weight matrix or tensor, which is a set of weights. Knowledge Distillation is one of the compression techniques that creates and trains a Student model smaller than the original model by using the original model as the Teacher model. In this case, the Student model may be generated through the aforementioned pruning, decomposition, or quantization.
이때, 사용자 기기 200의 성능에 따른 압축 정도는 다양한 방법을 통해 결정될 수 있다. 일 실시예로, 신경망 파일의 압축 정도는 사용자 기기 200의 단순 스펙을 바탕으로 결정될 수 있다. 즉, 압축 정도는 사용자 기기 200의 프로세서의 스펙, 메모리 스펙에 의해 일괄적으로 결정될 수 있다.In this case, the degree of compression according to the performance of the
또 다른 실시예로, 신경망 파일의 압축 정도는 사용자 기기 200의 사용 상태를 바탕으로 결정될 수 있다. 구체적으로, 서버 100은, 사용자 기기 200으로부터 사용 상태 정보를 수신하고, 수신된 사용 상태 정보에 따른 사용자 기기 200의 가용 리소스 정보를 획득할 수 있다. 서버 100은 사용자 기기 200의 가용 리소스 정보를 바탕으로 신경망 파일의 압축 정도를 결정할 수 있다. 이때, 가용 리소스 정보란, 사용자 기기 200이 실행중인 어플리케이션에 대한 정보, 실행중인 어플리케이션에 따라 결정되는 CPU 또는 GPU 점유율, 사용자 기기 200에 저장 가능한 메모리 용량과 관련된 정보일 수 있다.As another embodiment, the compression degree of the neural network file may be determined based on the use state of the
상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다. 요컨대 본 발명이 의도하는 효과를 달성하기 위해 도면에 도시된 모든 기능 블록을 별도로 포함하거나 도면에 도시된 모든 순서를 도시된 순서 그대로 따라야만 하는 것은 아니며, 그렇지 않더라도 얼마든지 청구항에 기재된 본 발명의 기술적 범위에 속할 수 있음에 주의한다.Although the present invention has been described in detail with reference to the above-described examples, those skilled in the art can make modifications, changes, and modifications to these examples without departing from the scope of the present invention. In short, in order to achieve the intended effect of the present invention, it is not necessary to separately include all the functional blocks shown in the drawings or follow all the orders shown in the drawings. Note that it may fall within the scope.
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020200157867AKR20220070866A (en) | 2020-11-23 | 2020-11-23 | Image enhancement method, device and program applied with deep learning technology |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020200157867AKR20220070866A (en) | 2020-11-23 | 2020-11-23 | Image enhancement method, device and program applied with deep learning technology |
| Publication Number | Publication Date |
|---|---|
| KR20220070866Atrue KR20220070866A (en) | 2022-05-31 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020200157867AWithdrawnKR20220070866A (en) | 2020-11-23 | 2020-11-23 | Image enhancement method, device and program applied with deep learning technology |
| Country | Link |
|---|---|
| KR (1) | KR20220070866A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024053828A1 (en)* | 2022-09-05 | 2024-03-14 | 주식회사 에어스 메디컬 | Artificial neural network-based super-resolution method, program, and apparatus |
| WO2024144222A1 (en)* | 2022-12-26 | 2024-07-04 | 서울대학교산학협력단 | Bilinear upsampling calculation apparatus and method |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024053828A1 (en)* | 2022-09-05 | 2024-03-14 | 주식회사 에어스 메디컬 | Artificial neural network-based super-resolution method, program, and apparatus |
| WO2024144222A1 (en)* | 2022-12-26 | 2024-07-04 | 서울대학교산학협력단 | Bilinear upsampling calculation apparatus and method |
| Publication | Publication Date | Title |
|---|---|---|
| KR102082815B1 (en) | Artificial intelligence based resolution improvement system | |
| US10904541B2 (en) | Offline training of hierarchical algorithms | |
| US10681361B2 (en) | Training end-to-end video processes | |
| KR20220070866A (en) | Image enhancement method, device and program applied with deep learning technology | |
| KR102130076B1 (en) | Method for improving the resolution of streaming files based on the learning importance of feature areas | |
| KR102130077B1 (en) | System to improve the resolution based on pattern information of grid generation | |
| KR20220021494A (en) | Artificial intelligence based resolution improvement system | |
| KR20220021495A (en) | Method for improving the resolution of streaming files based on AI | |
| CN112019892A (en) | Behavior identification method, device and system for separating client and server | |
| KR102130078B1 (en) | System for changing AI parameters based on resolution improvement | |
| WO2019209006A1 (en) | Method for improving resolution of streaming files | |
| JP7752353B2 (en) | Terminal, program, and information processing method for displaying low-resolution images as high-resolution images | |
| US20250054110A1 (en) | Image processing device, image processing method, and recording medium | |
| McCullough | Analysis of Machine Learning Upscaling Algorithms for Wireless Packet Loss | |
| KR20210120358A (en) | System and method of compressing video of virtual low loss |
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application | St.27 status event code:A-0-1-A10-A12-nap-PA0109 | |
| R17-X000 | Change to representative recorded | St.27 status event code:A-3-3-R10-R17-oth-X000 | |
| PG1501 | Laying open of application | St.27 status event code:A-1-1-Q10-Q12-nap-PG1501 | |
| R18-X000 | Changes to party contact information recorded | St.27 status event code:A-3-3-R10-R18-oth-X000 | |
| PC1203 | Withdrawal of no request for examination | St.27 status event code:N-1-6-B10-B12-nap-PC1203 | |
| P22-X000 | Classification modified | St.27 status event code:A-2-2-P10-P22-nap-X000 |