Movatterモバイル変換


[0]ホーム

URL:


JP2005341076A - Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium - Google Patents

Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium
Download PDF

Info

Publication number
JP2005341076A
JP2005341076AJP2004155421AJP2004155421AJP2005341076AJP 2005341076 AJP2005341076 AJP 2005341076AJP 2004155421 AJP2004155421 AJP 2004155421AJP 2004155421 AJP2004155421 AJP 2004155421AJP 2005341076 AJP2005341076 AJP 2005341076A
Authority
JP
Japan
Prior art keywords
encoded data
bit rate
data
image
hierarchically
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004155421A
Other languages
Japanese (ja)
Other versions
JP3936708B2 (en
Inventor
Hisami Shinsenji
久美 秦泉寺
Junichi Nakajima
淳一 中嶋
Kazuto Kamikura
一人 上倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone CorpfiledCriticalNippon Telegraph and Telephone Corp
Priority to JP2004155421ApriorityCriticalpatent/JP3936708B2/en
Publication of JP2005341076ApublicationCriticalpatent/JP2005341076A/en
Application grantedgrantedCritical
Publication of JP3936708B2publicationCriticalpatent/JP3936708B2/en
Anticipated expirationlegal-statusCritical
Expired - Lifetimelegal-statusCriticalCurrent

Links

Images

Landscapes

Abstract

Translated fromJapanese

【課題】通信会議システム等において,少ない符号化データ量でクライアントが見たい特定領域(ROI)の部分を高精細に表示できるようにする。
【解決手段】ROIの指示がない場合には,ビットレートトランスコード部16により,指定されたビットレートに収まるように拡張レイヤビットストリーム12の下位側のビットプレーンの符号化データをカットして送信する。ROIの指示があった場合には,拡張レイヤ領域トランスコード部15により,拡張レイヤビットストリーム12のROI選択領域41以外の可変長符号化データVLCを0に変換し,その後,ビットレートトランスコード部16により,指定されたビットレートに収まるように拡張レイヤビットストリーム12の下位側のビットプレーンの符号化データをカットして送信する。
【選択図】図1
In a teleconferencing system or the like, a specific area (ROI) portion that a client wants to see can be displayed with high definition with a small amount of encoded data.
When there is no ROI instruction, the bit rate transcoding unit 16 cuts and transmits the encoded data of the lower bit plane of the enhancement layer bit stream 12 so as to be within the specified bit rate. To do. When there is an instruction for ROI, the extension layer region transcoding unit 15 converts the variable length encoded data VLC other than the ROI selection region 41 of the enhancement layer bitstream 12 to 0, and then the bit rate transcoding unit. 16, the encoded data of the lower bit plane of the enhancement layer bit stream 12 is cut and transmitted so as to be within the specified bit rate.
[Selection] Figure 1

Description

Translated fromJapanese

本発明は,階層符号化データを用いた画像通信技術に係わり,特に多地点テレビ会議などの画像通信システムにおいて,ある指定されたビットレートのもとで特定の画像領域の部分の画質を簡易に向上させることができるようにした画像通信技術に関するものである。  The present invention relates to an image communication technique using hierarchically encoded data, and in particular, in an image communication system such as a multipoint video conference, the image quality of a specific image area portion can be easily simplified under a specified bit rate. The present invention relates to an image communication technique that can be improved.

従来の多地点通信会議システムとしては,例えば下記の特許文献1「多地点会議制御装置」,特許文献2「画像符号化方式及びその画像符号化方式を用いた多地点間テレビ会議方式」,特許文献3「多地点間テレビ会議装置」等に記載されたものが知られている。  As conventional multipoint communication conference systems, for example, the followingpatent document 1 “multipoint conference control device”,patent document 2 “image coding method and multipoint video conference system using the image coding method”, patent Those described inDocument 3 “Multipoint Video Conference Device” and the like are known.

一般にこれらの多地点通信会議システムでは,個人画像から興味のある領域の一部を切り出し,その部分を高精細に視聴することができなかった。  In general, in these multipoint communication conference systems, it is impossible to cut out a part of an area of interest from a personal image and view that part with high definition.

画像通信におけるスケーラブルな符号化方式としては,例えば下記の非特許文献1に記載されているようなMPEG−4・FGS(Fine Granularity Scalable) 符号化方式が知られている。このような階層符号化の目的は,伝送帯域の変動があった場合に,拡張レイヤを適応的にカットして,画像の途切れをなくすための機能を実現することである。また,一つのソースにて複数のビットストリームを取り出せるという,いわゆる One Source Multi-use を実現するものである。
特開平07−236128号公報特開平04−177993号公報特開昭63−174487号公報“AMENDMENT 4:Streaming video profile ”, ISO/IEC 14496-2:1999/FDAM4.
As a scalable encoding method in image communication, for example, an MPEG-4 FGS (Fine Granularity Scalable) encoding method as described in Non-PatentDocument 1 below is known. The purpose of such hierarchical coding is to realize a function for adaptively cutting the enhancement layer and eliminating the interruption of the image when the transmission band changes. It also realizes the so-called One Source Multi-use, in which multiple bit streams can be extracted from a single source.
JP 07-236128 A Japanese Patent Laid-Open No. 04-179933 JP-A 63-174487 “AMENDMENT 4: Streaming video profile”, ISO / IEC 14496-2: 1999 / FDAM4.

多地点テレビ会議などの通信会議システムにおいて,あるクライアントAが,他のクライアントBの個人画像の特定の領域部分だけを高精細に視聴したいと思った場合でも,従来方式では,サーバ装置とクライアント端末間で送受信される符号化データが,通常,一定のデータ量になるように符号化されているため,特定の領域部分だけを高精細に表示させることはできなかった。  In a communication conference system such as a multipoint video conference, even when a client A wants to view only a specific area portion of a personal image of another client B with high definition, in the conventional method, a server device and a client terminal Since the encoded data transmitted / received between them is usually encoded so as to have a certain amount of data, it was not possible to display only a specific area portion with high definition.

受信側のクライアント端末で,クライアントが見たい特定の領域部分を高精細に表示することができるようにする方法として考えられるのは,データ量が少ない通常の符号化データストリームと,データ量が多い高精細版の符号化データストリームの2本のストリームデータを,サーバ装置が,常時クライアント端末から受信し,受信側のクライアント端末からの要求によって,通常のストリームデータを高精細版のストリームデータに切り替える方法である。しかし,この方法では,通常のストリームデータから高精細版のストリームデータに切り替えたときにデータ量が大幅に増加するため,帯域幅に制限があるときに,その帯域幅の中でストリームデータを円滑に送信することができないという問題がある。  As a method for enabling the client terminal on the receiving side to display a specific area portion desired by the client in high definition, a normal encoded data stream with a small amount of data and a large amount of data are considered. The server device always receives two stream data of the encoded data stream of the high definition version from the client terminal, and switches the normal stream data to the high definition version of the stream data in response to a request from the client terminal on the receiving side. Is the method. However, this method greatly increases the amount of data when switching from normal stream data to high-definition version stream data. Therefore, when the bandwidth is limited, stream data is smoothed within that bandwidth. There is a problem that cannot be sent to.

この問題は,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化方式による符号化データとして,各クライアント端末に画像データを配信する場合にも同様に発生する。すなわち,基本レイヤビットストリームと拡張レイヤビットストリームのすべてのレイヤの符号化データを各クライアント端末に配信した場合には,データ量が増大化するため,ネットワークによる伝送能力やクライアント端末の通信処理能力で対応することができなくなるという問題がある。  This problem also occurs when image data is distributed to each client terminal as encoded data based on a hierarchical encoding method composed of a base layer bit stream and an enhancement layer bit stream. In other words, when the encoded data of all layers of the base layer bit stream and the enhancement layer bit stream is distributed to each client terminal, the amount of data increases, so the transmission capacity by the network and the communication processing capacity of the client terminal There is a problem that it becomes impossible to cope.

本発明は上記問題点の解決を図り,通信会議システム等において階層符号化方式により符号化された映像をリアルタイムに受信し表示する装置が,ある制限されたビットレートのもとで,すなわち少ない符号化データ量で画像の特定の部分だけを高精細に表示することができるようにすることを目的とする。  The present invention has been made to solve the above-mentioned problems, and an apparatus for receiving and displaying a video encoded by a hierarchical encoding method in a teleconferencing system or the like in real time has a limited bit rate, that is, a small code. It is an object of the present invention to display only a specific portion of an image with high definition by using a digitized data amount.

上記課題を解決するため,本発明は,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータの通信を行う画像通信システムにおいて,前記データのビットレートを指示するビットレート指示手段と,送信対象となる前記階層符号化されたデータのデータ量が,前記ビットレート指示手段により指示されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,送信される階層符号化されたデータを復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示手段と,前記画質向上領域指示手段により高精細に表示させる特定部分の領域の指示があった場合に,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段とを備えることを特徴とする。  In order to solve the above problems, the present invention provides a bit rate indicating means for indicating a bit rate of the data in an image communication system that performs communication of hierarchically encoded data including a base layer bit stream and an enhancement layer bit stream. And the enhancement layer bits of the hierarchically encoded data so that the data amount of the hierarchically encoded data to be transmitted is a data amount that matches the bit rate specified by the bit rate indicating means. Bit rate transcoding that adjusts the bit rate by performing code conversion that truncates the encoded data in the order of the encoded data of the lower plane of the stream, the encoded data of the upper plane, and then the encoded data of the base layer And the characteristics of the decoded image of the hierarchically encoded data to be transmitted. When there is an image quality improvement area instruction means for instructing to display a partial area with higher definition than the other parts, and a specific portion area to be displayed with high definition by the image quality improvement area instruction means, Before the bit rate adjustment by the bit rate transcoding means, the amount of encoded data corresponding to an area other than the specific part of the enhancement layer bit stream of the hierarchically encoded data to be transmitted And an enhancement layer region transcoding means for performing code conversion for reducing the amount of data.

また,前記階層符号化されたデータは,拡張レイヤの解像度が基本レイヤの解像度のn倍(ただしn>1)の解像度を持つデータであることを特徴とする。  The hierarchically encoded data is data in which the resolution of the enhancement layer is n times (where n> 1) the resolution of the base layer.

図1は,本発明の概要を説明するための図である。本発明は,テレビ会議システムなどの画像通信システムにおいて,所定のビットレート(帯域幅)のもとで,指定された特定の領域(以下,ROI(Region Of Interest)選択領域という)を高精細に表示することを,階層符号化方式における拡張レイヤビットストリームを操作することにより実現するものである。  FIG. 1 is a diagram for explaining the outline of the present invention. According to the present invention, in a video communication system such as a video conference system, a specified specific region (hereinafter referred to as ROI (Region Of Interest) selection region) is defined with high definition under a predetermined bit rate (bandwidth). The display is realized by manipulating the enhancement layer bit stream in the hierarchical coding system.

スケーラブルな符号化が可能な階層符号化方式では,入力映像を基本レイヤ符号化部と拡張レイヤ符号化部とによって符号化し,符号化データをそれぞれ基本レイヤビットストリーム11,拡張レイヤビットストリーム12として出力する。拡張レイヤビットストリーム12は,通常,図1(A)に示すように複数のビットプレーン(レイヤ)P1〜Pkの可変長符号化データVLCからなる。  In the hierarchical encoding method capable of scalable encoding, the input video is encoded by the base layer encoding unit and the enhancement layer encoding unit, and the encoded data is output as the baselayer bit stream 11 and the enhancementlayer bit stream 12, respectively. To do. The enhancementlayer bit stream 12 is usually composed of variable length encoded data VLC of a plurality of bit planes (layers) P1 to Pk as shown in FIG.

ビットレートトランスコード部16は,受信側の装置から指示されたビットレートによる転送可能ビット量に応じて,拡張レイヤビットストリーム12の下位側のビットプレーンをカットすることにより,送信するビットストリームのビット量を,指示されたビットレートで送ることができるように調整する処理を行うものである。  The bitrate transcoding unit 16 cuts the bit plane of the bit stream to be transmitted by cutting the lower bit plane of the enhancementlayer bit stream 12 in accordance with the transferable bit amount at the bit rate instructed by the receiving device. The amount is adjusted so that it can be sent at the specified bit rate.

一般に拡張レイヤビットストリーム12のデータ量は,基本レイヤビットストリーム11のデータ量よりも多くなる。図1(A)に示す例では,指示されたビットレートによる転送可能ビット量から,基本レイヤビットストリーム11と拡張レイヤビットストリーム12のうち最上位レイヤのビットプレーンP1の符号化データだけを送信している。ビットレートによっては,拡張レイヤビットストリーム12をまったく送らない場合もあり,また基本レイヤビットストリーム11におけるBピクチャ,さらにPピクチャをカットする場合もある。もちろん,拡張レイヤビットストリーム12として送信するビットプレーン数が多ければ多いほど,受信側の装置において符号化データを復号した画像は,高精細に表示されることになる。  In general, the data amount of the enhancementlayer bit stream 12 is larger than the data amount of the baselayer bit stream 11. In the example shown in FIG. 1 (A), only the encoded data of the bit plane P1 of the highest layer of the baselayer bit stream 11 and the enhancementlayer bit stream 12 is transmitted from the transferable bit amount at the designated bit rate. ing. Depending on the bit rate, the enhancementlayer bit stream 12 may not be sent at all, and the B picture and further the P picture in the baselayer bit stream 11 may be cut. Of course, as the number of bit planes transmitted as the enhancementlayer bit stream 12 increases, an image obtained by decoding the encoded data in the receiving device is displayed with higher definition.

本発明は,例えば図1(B)に示すように,受信側の装置において表示された表示画像40において,ある特定の領域を高精細に見たいというユーザの希望により,ユーザがROI指示部23によってROI選択領域41を指定した場合,送信側の装置では,そのROI情報を受け取り,拡張レイヤ領域トランスコード部15が拡張レイヤビットストリーム12の符号化データを次のように加工する。すなわち,拡張レイヤビットストリーム12の可変長符号化データVLCのうち,ROI選択領域41以外の部分をすべて“0”のコードに置き換える。ROI選択領域41に含まれる部分の可変長符号化データVLCは,元の値のままとする。  In the present invention, for example, as shown in FIG. 1 (B), the user desires to view a specific area with high definition in adisplay image 40 displayed on the receiving-side apparatus. When theROI selection area 41 is designated by the above, the apparatus on the transmission side receives the ROI information, and the enhancement layerarea transcoding unit 15 processes the encoded data of theenhancement layer bitstream 12 as follows. That is, all the portions other than theROI selection area 41 in the variable length encoded data VLC of theenhancement layer bitstream 12 are replaced with “0” codes. The variable length encoded data VLC of the part included in theROI selection area 41 is kept at the original value.

このようにROI選択領域41以外の部分の可変長符号化データVLCをすべて“0”コードにすれば,各ビットプレーンP1〜Pkのデータ量は大幅に削減されることになる。したがって,ビットレートトランスコード部16では,図1(A)と同一のビットレートのもとで,図1(B)に示すように,拡張レイヤビットストリーム12の多くのビットプレーン(例えばP1〜Pj)の符号化データを,送信することができるようになる。  If all the variable length encoded data VLC other than theROI selection area 41 are set to “0” code in this way, the data amount of each bit plane P1 to Pk is greatly reduced. Therefore, the bitrate transcoding unit 16 uses a number of bit planes (for example, P1 to Pj) of the enhancementlayer bit stream 12 as shown in FIG. 1B under the same bit rate as that in FIG. ) Encoded data can be transmitted.

受信側の装置がこのビットストリームを復号して表示した場合,表示画像40におけるROI選択領域41以外の部分は,基本レイヤビットストリーム11の復号画像として見ることができ,ROI選択領域41の部分については,さらにビットプレーンP1〜Pjの符号化データを用いた高精細な画像として見ることができることになる。  When the receiving side apparatus decodes and displays this bit stream, the part other than theROI selection area 41 in thedisplay image 40 can be viewed as the decoded image of the baselayer bit stream 11. Can be viewed as a high-definition image using the encoded data of the bit planes P1 to Pj.

本発明によれば,階層符号化方式により符号化された画像を受信する装置が,同一ビットレートのもとで,画像の特定の部分だけを高精細に表示することができるようになる。特に,複数の個人画像を表示するようなテレビ会議システムにおいて,帯域幅に制限があるような場合に,特定の個人画像の特定の領域を高精細に切り換えて表示することができるようになり,会議資料の高精細な表示などにより会議を円滑に進行させることができるようになる。  According to the present invention, an apparatus that receives an image encoded by a hierarchical encoding method can display only a specific portion of an image with high definition at the same bit rate. In particular, in a video conference system that displays multiple personal images, when the bandwidth is limited, a specific area of a specific personal image can be switched in high definition and displayed. The meeting can be smoothly advanced by high-definition display of meeting materials.

以下,図面を用いて本発明の実施の形態を説明する。図2は,本発明を適用した4者間の通信会議システムの例を示している。各クライアント端末2A〜2Dは,それぞれ自端末で撮影した映像を階層符号化方式により符号化してビットストリームを生成し,上りセッションにてサーバ装置1にアップロードする。サーバ装置1は,テレビ会議を制御する多地点接続装置(MCU:Multipoint Connection Unit)であり,サーバ装置1では,各クライアント端末2A〜2Dから要求のあったデータ量だけを切り出して,個々のクライアント端末2A〜2Dに,基本レイヤビットストリームと拡張レイヤビットストリームからなる階層符号化されたデータを配信する。  Embodiments of the present invention will be described below with reference to the drawings. FIG. 2 shows an example of a communication conference system between four parties to which the present invention is applied. Each of theclient terminals 2A to 2D generates a bit stream by encoding the video captured by the own terminal using the hierarchical encoding method, and uploads the bit stream to theserver apparatus 1 in the uplink session. Theserver device 1 is a multipoint connection unit (MCU: Multipoint Connection Unit) that controls a video conference. Theserver device 1 cuts out only the amount of data requested from each of theclient terminals 2A to 2D, and makes an individual client. The hierarchically encoded data composed of the base layer bit stream and the enhancement layer bit stream is distributed to theterminals 2A to 2D.

図3は,サーバ装置とクライアント端末の構成例を示している。クライアント端末については,説明を分かりやすくするために,自画像をサーバ装置1にアップロードするクライアント端末(送信側)2と,サーバ装置1からスケーラブルビットストリームを受信して復号し,画像を表示するクライアント端末(受信側)2’とを分けて書いてある。実際には,各クライアント端末は,送信側と受信側の両方の機能を持つ。  FIG. 3 shows a configuration example of the server device and the client terminal. For easy understanding of the client terminal, a client terminal (transmission side) 2 that uploads the self-portrait to theserver apparatus 1 and a client terminal that receives and decodes a scalable bitstream from theserver apparatus 1 and displays an image. (Receiving side) 2 'is written separately. Actually, each client terminal has functions of both a transmitting side and a receiving side.

サーバ装置1は,各クライアント端末2からのスケーラブルビットストリーム(基本レイヤビットストリーム11と拡張レイヤビットストリーム12)を受信する受信バッファ10と,クライアント端末(受信側)2’からROI情報を受信するROI情報受信部13と,ROIの有無によってデータの流れを切り換えるROI切換え部14と,拡張レイヤ領域トランスコード部15と,ビットレートトランスコード部16と,スケーラブルビットストリームを各クライアント端末(受信側)2’に送信するための送信バッファ17と,クライアント端末(受信側)2’から指示されたビットレート情報を受信するビットレート受信部18と,受信したビットレートをビットレートトランスコード部16へ伝達するビットレート指示部19とを備える。  Theserver apparatus 1 includes areception buffer 10 that receives a scalable bit stream (baselayer bit stream 11 and enhancement layer bit stream 12) from eachclient terminal 2, and an ROI that receives ROI information from a client terminal (receiving side) 2 ′.Information receiving unit 13,ROI switching unit 14 for switching data flow depending on presence / absence of ROI, enhancement layerregion transcoding unit 15, bitrate transcoding unit 16, and scalable bit stream for each client terminal (receiving side) 2 The transmission buffer 17 for transmitting to ', the bitrate receiving unit 18 for receiving the bit rate information instructed from the client terminal (receiving side) 2', and the received bit rate to the bit rate transcoding unit 16 A bitrate instruction unit 19 and Provided.

クライアント端末(送信側)2は,映像を入力するカメラ20と,カメラ20から入力した映像を階層符号化する階層符号化部21と,階層符号化部21により符号化したスケーラブルビットストリームを送信するための送信バッファ22とを備える。  The client terminal (transmission side) 2 transmits acamera 20 that inputs video, a hierarchical encoding unit 21 that hierarchically encodes video input from thecamera 20, and a scalable bitstream encoded by the hierarchical encoding unit 21. Atransmission buffer 22.

また,クライアント端末(受信側)2’は,ユーザからROI選択領域の指示を入力するROI指示部23と,指示されたROI情報をサーバ装置1へ送信するROI情報送信部24と,サーバ装置1からスケーラブルビットストリームを受信するための受信バッファ25と,受信したスケーラブルビットストリームを復号する階層復号部26と,復号画像を表示するディスプレイ等の表示部27と,自装置で受信を希望するデータ量のビットレート情報をサーバ装置1へ送信するビットレート送信部28とを備える。  Further, the client terminal (reception side) 2 ′ includes anROI instruction unit 23 for inputting an instruction for the ROI selection area from the user, an ROIinformation transmission unit 24 for transmitting the instructed ROI information to theserver apparatus 1, and theserver apparatus 1. Receivingbuffer 25 for receiving a scalable bit stream from the layer, ahierarchical decoding unit 26 for decoding the received scalable bit stream, adisplay unit 27 such as a display for displaying the decoded image, and a data amount desired to be received by the own device The bitrate transmission unit 28 transmits the bit rate information to theserver device 1.

図3に示す例では,クライアント端末(受信側)2’がROI選択領域を指定しているが,サーバ装置1がROI選択領域を指定してもよい。例えば,テレビ会議において特定のクライアントが発話した場合に,複数のクライアントの画像の中で,発話したクライアントの画像の顔部分の領域を,画像認識により自動的にROI選択領域とするようなこともできる。  In the example shown in FIG. 3, the client terminal (reception side) 2 'designates the ROI selection area, but theserver apparatus 1 may designate the ROI selection area. For example, when a specific client speaks in a video conference, the region of the face portion of the spoken client image among the images of a plurality of clients is automatically set as the ROI selection region by image recognition. it can.

クライアント端末(受信側)2’においてデータを受信するときのビットレートは,例えばビットレートもしくは受信するビットストリームのデータ量を入力するためのスライダーバーを表示部27に表示し,ユーザに指定させてもよいし,クライアント端末(受信側)2’が規定値もしくは通信状況に応じて自動的に決定してもよい。また,データを受信するときのビットレートをクライアント端末(受信側)2’が指定するのではなく,ネットワークの状況などに応じてネットワーク上の装置またはサーバ装置1が指定するようにしてもよい。  For the bit rate when data is received at the client terminal (reception side) 2 ′, for example, a slider bar for inputting the bit rate or the amount of data of the bit stream to be received is displayed on thedisplay unit 27 and the user specifies it. Alternatively, the client terminal (reception side) 2 ′ may automatically determine according to a specified value or a communication status. In addition, the client terminal (reception side) 2 'may specify the bit rate for receiving data, but the network apparatus or theserver apparatus 1 may specify it according to the network status.

クライアント端末(送信側)2は,スケーラブルビットストリームを送信しているが,非スケーラブル符号化データを送信するクライアント端末が存在してもよい。  The client terminal (transmission side) 2 transmits a scalable bit stream, but there may be a client terminal that transmits non-scalable encoded data.

サーバ装置1には,複数のクライアント端末からスケーラブルデータもしくは非スケーラブルデータが上がってくる(上りの符号化データ)。各クライアント端末は,これらのデータを,クライアント指定もしくはサーバ装置1が自動的に判断した任意のビットレートおよびROI情報によって目的とする符号化データにトランスコードしたものを受信する。  Theserver device 1 receives scalable data or non-scalable data from a plurality of client terminals (upstream encoded data). Each client terminal receives data obtained by transcoding these data into target encoded data based on client designation or an arbitrary bit rate automatically determined by theserver apparatus 1 and ROI information.

以下では,クライアントAが他のクライアントBの画像領域をROI選択領域として指定し,またそのデータの受信ビットレートをサーバ装置1に対して指定した場合の動作を説明する。クライアントA(図3ではクライアント端末(受信側)2’のクライアント)は,受信している複数のクライアントの画像うち,特定のクライアントB(図3ではクライアント端末(送信側)2のクライアント)を選択し,クライアントBの符号化データの受信ビットレートとROI情報を,それぞれビットレート送信部28とROI情報送信部24によってサーバ装置1に通知する。サーバ装置1は,ビットレート受信部18およびROI情報受信部13にて,それぞれ受信ビットレートおよびROI情報をクライアントAのクライアント端末(受信側)2’から受ける。  Hereinafter, an operation when the client A designates the image area of another client B as the ROI selection area and designates the reception bit rate of the data to theserver apparatus 1 will be described. The client A (client of the client terminal (reception side 2 ′ in FIG. 3)) selects a specific client B (client of the client terminal (transmission side) 2 in FIG. 3) from the plurality of received client images. Then, the reception bit rate and the ROI information of the encoded data of the client B are notified to theserver apparatus 1 by the bitrate transmission unit 28 and the ROIinformation transmission unit 24, respectively. Theserver apparatus 1 receives the reception bit rate and the ROI information from the client terminal (reception side) 2 ′ of the client A at the bitrate reception unit 18 and the ROIinformation reception unit 13, respectively.

ROI情報は,ROI指定があるかないかの情報,およびROI指定がある場合に,そのROI選択領域の位置およびサイズを示す領域情報である。この領域情報は,領域が矩形の場合,例えば左上隅の座標と右下隅の座標の座標情報のようなものでよい。また,領域が任意形状の場合,例えばマクロブロックごとに,ROI選択領域に属するマクロブロックの位置を“1”,ROI選択領域に属さないマクロブロックの位置を“0”に設定したビットマップデータのようなものでもよい。  The ROI information is information indicating whether or not there is ROI designation, and area information indicating the position and size of the ROI selection area when there is ROI designation. When the area is rectangular, the area information may be, for example, coordinate information of the coordinates of the upper left corner and the coordinates of the lower right corner. Also, if the area has an arbitrary shape, for example, for each macroblock, bitmap data in which the position of a macroblock belonging to the ROI selection area is set to “1” and the position of a macroblock not belonging to the ROI selection area is set to “0”. Something like that.

サーバ装置1は,受信したビットレート情報とROI情報とに基づいて,拡張レイヤ領域トランスコード部15およびビットレートトランスコード部16によるトランスコード処理を行う。  Theserver device 1 performs transcoding processing by the enhancement layerregion transcoding unit 15 and the bitrate transcoding unit 16 based on the received bit rate information and ROI information.

クライアントAからクライアントBの画像についてのROIの指示があった場合,指定されたクライアントBの拡張レイヤビットストリーム12を,ROI切換え部14を介して拡張レイヤ領域トランスコード部15へ送る。拡張レイヤ領域トランスコード部15では,クライアントBの拡張レイヤビットストリーム12の中で,ROI選択領域に入らないマクロブロックの可変長符号化データを“0”というコードに置き換えてビットレートトランスコード部16へ出力する。ROI選択領域に入る部分の可変長符号化データはそのまま出力する。  When there is an ROI instruction for the image of client B from client A, the enhancementlayer bit stream 12 of the designated client B is sent to the enhancement layerregion transcoding unit 15 via theROI switching unit 14. The enhancement layerregion transcoding unit 15 replaces the variable-length encoded data of macroblocks that do not enter the ROI selection region in theenhancement layer bitstream 12 of the client B with the code “0”, thereby converting the bitrate transcoding unit 16. Output to. The variable length encoded data in the portion that enters the ROI selection area is output as it is.

ビットレートトランスコード部16は,受信バッファ10から基本レイヤビットストリーム11を入力し,また拡張レイヤ領域トランスコード部15からトランスコードした拡張レイヤビットストリーム12を入力し,またビットレート指示部19からビットレート指示情報を入力する。ビットレートトランスコード部16は,入力されたビットストリームにおいて,ビットレート指示部19により指示された任意のビットレートになるまで,送信するビットストリームのデータ量を削減するため,拡張レイヤの下位側のビットプレーンから順番に符号化データに“0”を入れる。拡張レイヤのデータがなくなった場合には,基本レイヤのBピクチャから“0”とし,次にPピクチャ,Iピクチャの順に符号化データを“0”とする。ビットレートトランスコード部16にてトランスコードされたクライアントBのビットストリームは,送信バッファ17に送られ,送信バッファ17からクライアントAのクライアント端末(受信側)2’へ送信される。  The bitrate transcoding unit 16 receives the baselayer bit stream 11 from thereception buffer 10, receives the enhancementlayer bit stream 12 transcoded from the enhancement layerregion transcoding unit 15, and receives the bit from the bitrate instruction unit 19. Enter rate indication information. In order to reduce the amount of data of the bit stream to be transmitted until the bitrate transcoding unit 16 reaches an arbitrary bit rate instructed by the bitrate instructing unit 19 in the input bit stream, the bitrate transcoding unit 16 “0” is put in the encoded data in order from the bit plane. When there is no more enhancement layer data, the base layer B picture is set to “0”, and then the encoded data is set to “0” in the order of P picture and I picture. The bit stream of the client B transcoded by the bitrate transcoding unit 16 is sent to the transmission buffer 17 and is transmitted from the transmission buffer 17 to the client terminal (receiving side) 2 ′ of the client A.

一方,ROIの指示がない場合,すなわち,クライアントAがクライアントBの画像に対して,ROIの指定を行わず,ビットレートの指定(必須)のみを行った場合には,受信バッファ10中のクライアントBの基本レイヤビットストリーム11および拡張レイヤビットストリーム12は,直接,ビットレートトランスコード部16へ送られ,ビットレートトランスコード部16でビットレート指示部19により指定されたビットレートに相当するデータ量に調整され,送信バッファ17を介して,クライアントAのクライアント端末(受信側)2’へ送信される。  On the other hand, when there is no ROI instruction, that is, when the client A does not specify the ROI for the image of the client B but only specifies the bit rate (required), the client in thereception buffer 10 The baselayer bit stream 11 and the enhancementlayer bit stream 12 of B are directly sent to the bitrate transcoding unit 16 and the data amount corresponding to the bit rate specified by the bitrate indicating unit 19 in the bitrate transcoding unit 16 Is transmitted to the client terminal (reception side) 2 ′ of the client A via the transmission buffer 17.

図4は,拡張レイヤ領域トランスコード部15の処理を説明するフローチャートである。拡張レイヤにMPEG−4のFGS(Fine Granularity Scalable) 符号化を用いるものとする。FGS符号化の場合,拡張レイヤのビットストリームは,基本的にマクロブロック単位の可変長符号化データVLCから構成される。よって,ROI選択領域に相当しないマクロブロックの可変長符号化データVLCをすべて“0”に置き換えることで,トランスコードができる。すなわち,この個々の可変長符号化データVLCがROIの領域であるなら,VLCに何も操作せず,ROI以外の領域であるなら,VLCを“0”のコードに置き換える。  FIG. 4 is a flowchart for explaining the processing of the enhancement layerregion transcoding unit 15. It is assumed that MPEG-4 Fine Granularity Scalable (FGS) encoding is used for the extension layer. In the case of FGS encoding, the enhancement layer bitstream is basically composed of variable-length encoded data VLC in units of macroblocks. Therefore, transcoding can be performed by replacing all variable length encoded data VLC of macroblocks not corresponding to the ROI selection area with “0”. That is, if the individual variable-length encoded data VLC is an ROI area, no operation is performed on the VLC, and if it is an area other than the ROI, the VLC is replaced with a code “0”.

すなわち,拡張レイヤビットストリーム12の各マクロブロックごとに,図4に示す処理を実行する。f番目のフレームのl番目のレイヤのm個目のマクロブロックにおけるVLC符号を,VLCf(l,m)とし,f番目のフレームのm個目のマクロブロックにおける選択領域情報を,Rf(m)とする。なお,このm個目のマクロブロックがROI選択領域内であれば,Rf(m)=1であり,ROI選択領域外であれば,Rf(m)=0と定義されているものとする。That is, the process shown in FIG. 4 is executed for each macroblock of theenhancement layer bitstream 12. The VLC code in the m-th macroblock of the l-th layer of the f-th frame is VLCf (l, m), and the selection area information in the m-th macroblock of the f-th frame is Rf ( m). If the m-th macroblock is within the ROI selection area, Rf (m) = 1, and if it is outside the ROI selection area, Rf (m) = 0 is defined. To do.

ステップS1では,現在処理しているm個目のマクロブロックのRf(m)が0かどうかを判定する。0でない場合には,そのマクロブロックのVLCf(l,m)を,VLC符号としてそのまま出力する。Rf(m)が0の場合,ステップS2においてVLCf(l,m)を“0”のコードに置き換えて出力する。ステップS3では,変換後の拡張レイヤビットストリーム12を再構成してビットレートトランスコード部16へ出力する。このビットストリームの再構成は,VLCf(l,m)が“0”のコードを圧縮する処理であり,きわめて簡単なコード変換処理で実現することができる。In step S1, it is determined whether Rf (m) of the m-th macroblock currently processed is 0. If it is not 0, VLCf (l, m) of the macroblock is output as it is as a VLC code. If Rf (m) is 0, VLCf (l, m) is replaced with a code of “0” and output in step S2. In step S3, the converted enhancementlayer bit stream 12 is reconstructed and output to the bitrate transcoding unit 16. This reconstruction of the bitstream is a process of compressing a code whose VLCf (l, m) is “0”, and can be realized by a very simple code conversion process.

図5は,ビットレートトランスコード部16の処理を説明するフローチャートである。本実施の形態で扱う拡張レイヤビットストリーム12のデータ形式は,図5(A)に示すように,1フレーム分の可変長符号化データ(VLC)の前に,FGSのVOP(Video Object Plane)スタートコードビットScが付加された形式になっている。FIG. 5 is a flowchart for explaining the processing of the bitrate transcoding unit 16. As shown in FIG. 5A, the data format of theenhancement layer bitstream 12 handled in this embodiment is an FGS VOP (Video Object Plane) before one frame of variable-length encoded data (VLC). The start code bitSc is added.

クライアントから指示されたビットレートをBc[bit per sec ],直前のGOVのフレームレートf[frames per sec]とする。まず,ステップS10では,Bcをfで割る(Bv=Bc/f)ことにより,1フレーム当たりのビット量Bvを計算する。The bit rate instructed by the client is Bc [bit per sec], and the frame rate f [frames per sec] of the previous GOV is assumed. First, in step S10, the bit amount Bv per frame is calculated by dividing Bc by f (Bv = Bc / f).

次に,ステップS11では,ビット量をカウントするためのビットカウント値を“0”に初期化する。ステップS12では,拡張レイヤビットストリーム12の先頭から順番にビットデータを取り出して解析する。取り出したビットデータがFGSのVOPスタートコードビットScであれば(ステップS13),ステップS11へ戻り,再度,ビットカウント値を“0”に初期化してカウントを続ける。In step S11, a bit count value for counting the bit amount is initialized to “0”. In step S12, bit data is extracted and analyzed in order from the beginning of theenhancement layer bitstream 12. If the bit data of the FGS VOP start code bits Sc extracted (step S13), and returns to step S11, again, continues to count is initialized to a bit count value "0".

FGSのVOPスタートコードビットScでなければ,ビットカウント値がBvを超えるか(ステップS15),次のFGSのVOPスタートコードビットScが現れるまで(ステップS13),ビットカウント値をカウントアップし,符号化ビットをカウントする。ビットカウント値が1フレーム当たりのビット量Bvを超えたら,ステップS16へ進み,そのフレームの残りのデータ(VLC),すなわち次のFGSのVOPスタートコードビットScが現れるまでのデータをすべて“0”というコードにする。以上の処理を一連の拡張レイヤビットストリーム12について繰り返す。Otherwise VOP start code bits Sc of FGS, whether the bit count is greater than Bv (step S15), and until a VOP start code bits Sc of the next FGS (step S13), and increments the bit counter value And count the coded bits. When the bit count value exceeds the amount of bits Bv per frame, the process proceeds to step S16, the remaining data of the frame (VLC), ie, all data until a VOP start code bits Sc of the next FGS " The code is “0”. The above processing is repeated for a series ofenhancement layer bitstreams 12.

ビットレートトランスコード部16は,以上の処理をGOV(Iピクチャから次のIピクチャまでのデータ)ごとに行うことによって,クライアントが指定したビットレートとなるように,送信するビットストリームのビット量を調整することができる。  The bitrate transcoding unit 16 performs the above processing for each GOV (data from the I picture to the next I picture), thereby reducing the bit amount of the bit stream to be transmitted so that the bit rate specified by the client is obtained. Can be adjusted.

図6〜図8は,図3に示すクライアント端末(送信側)2における階層符号化部21の構成例を示す。いずれもMPEG−4 ASP/FGS符号化方式による基本レイヤと拡張レイヤからなる階層符号化を行うものである。図6および図7は,基本レイヤと拡張レイヤとが同じ解像度を持つ場合の階層符号化方式を示しており,一般に知られているものである。図8は,従来の階層符号化方式を本実施の形態のために改良したものであり,拡張レイヤが基本レイヤの2倍の解像度を持つ階層符号化を行うものである。なお,図6〜図8では,図をわかりやすくするために動き検出部および動き補償部については図示を省略している。  6 to 8 show configuration examples of the hierarchical encoding unit 21 in the client terminal (transmission side) 2 shown in FIG. In either case, hierarchical encoding consisting of a base layer and an enhancement layer by the MPEG-4 ASP / FGS encoding method is performed. FIG. 6 and FIG. 7 show a hierarchical encoding method when the base layer and the enhancement layer have the same resolution, and are generally known. FIG. 8 shows an improvement of the conventional hierarchical encoding method for this embodiment, in which the enhancement layer performs hierarchical encoding with twice the resolution of the base layer. 6 to 8, the motion detection unit and the motion compensation unit are not shown for easy understanding of the drawings.

まず,図6の階層符号化方式について説明する。基本レイヤの符号化では,デジタル化された入力映像211が入力されると,減算器212により入力映像211と動き補償された予測画像との差分が算出される。DCT部213は,この差分信号を離散コサイン変換し,結果のDCT係数を出力する。量子化部214は,そのDCT係数を量子化し,量子化結果を可変長符号化部215と,逆量子化部216へ出力する。可変長符号化部215は,量子化されたDCT係数を可変長符号化し,基本レイヤビットストリームを生成する。逆量子化部216は,量子化されたDCT係数を逆量子化し,逆DCT部217は,さらにそれを逆離散コサイン変換して,予測画像に用いるための復号画像を生成する。  First, the hierarchical encoding method of FIG. 6 will be described. In the encoding of the base layer, when the digitizedinput video 211 is input, thesubtracter 212 calculates the difference between theinput video 211 and the motion compensated predicted image. TheDCT unit 213 performs a discrete cosine transform on the difference signal and outputs the resulting DCT coefficient. Thequantization unit 214 quantizes the DCT coefficient and outputs the quantization result to the variablelength coding unit 215 and theinverse quantization unit 216. The variablelength coding unit 215 performs variable length coding on the quantized DCT coefficient to generate a base layer bit stream. Theinverse quantization unit 216 inversely quantizes the quantized DCT coefficient, and theinverse DCT unit 217 further performs inverse discrete cosine transform to generate a decoded image for use in the predicted image.

拡張レイヤの符号化では,逆量子化部216と逆DCT部217とによってローカルデコードされた基本レイヤの復号画像と,入力映像211との差分画像を減算器218によって算出し,それをDCT部219によって離散コサイン変換する。ビットプレーン展開部220は,DCT係数をそのままビットプレーン展開し,選択的拡張処理部(SE:Selective Enhancement )221は,可変長符号化する前のビットプレーン展開されたDCT係数の符号化優先順位の変更を行う。可変長符号化部222は,その結果を可変長符号化し,拡張レイヤビットストリームを生成する。  In the enhancement layer coding, asubtractor 218 calculates a difference image between the base layer decoded image locally decoded by theinverse quantization unit 216 and theinverse DCT unit 217 and theinput video 211, and theDCT unit 219 calculates the difference image. The discrete cosine transform is performed by The bitplane expansion unit 220 expands the DCT coefficient as it is, and the selective enhancement processing unit (SE: Selective Enhancement) 221 sets the coding priority of the DCT coefficient expanded in the bit plane before variable length encoding. Make a change. The variablelength coding unit 222 performs variable length coding on the result and generates an enhancement layer bit stream.

図7に示す構成による階層符号化部による符号化は,次のように入力映像231の階層符号化を行う。基本レイヤの符号化は,図6と同様であり,減算器232,DCT部233,量子化部234,可変長符号化部235,逆量子化部236および逆DCT部237によって,基本レイヤビットストリームの生成と,次の予測符号化のための復号画像の生成を行う。  The encoding by the hierarchical encoding unit having the configuration shown in FIG. 7 performs hierarchical encoding of theinput video 231 as follows. The base layer encoding is the same as in FIG. 6, and the base layer bit stream is obtained by thesubtractor 232, theDCT unit 233, thequantization unit 234, the variablelength encoding unit 235, theinverse quantization unit 236 and theinverse DCT unit 237. And a decoded image for the next predictive coding.

拡張レイヤの符号化では,基本レイヤにおけるDCT部233によるDCT変換直後のDCT係数と,量子化部234による量子化,逆量子化部236による逆量子化した後のDCT係数との差分を,減算器238によって直接的に計算する。このDCT係数の差分をビットプレーン展開部239によってビットプレーン展開する。選択的拡張処理部(SE)240は,可変長符号化する前のビットプレーン展開された差分DCT係数の符号化優先順位の変更を行い,可変長符号化部241は,その結果を可変長符号化して拡張レイヤビットストリームを生成する。この方法によっても,FGS符号化シンタックスに則ったビットストリームを生成することができ,図6の方法よりも処理を高速化することができる。  In the enhancement layer encoding, the difference between the DCT coefficient immediately after the DCT transform by theDCT unit 233 in the base layer and the DCT coefficient after the quantization by thequantization unit 234 and the inverse quantization by theinverse quantization unit 236 is subtracted. It is calculated directly by theinstrument 238. The bitplane expansion unit 239 expands the difference between the DCT coefficients. The selective extension processing unit (SE) 240 changes the coding priority of the differential DCT coefficient expanded in the bit plane before variable length coding, and the variablelength coding unit 241 converts the result into the variable length code. To generate an enhancement layer bitstream. Also with this method, it is possible to generate a bitstream conforming to the FGS encoding syntax, and it is possible to speed up the processing compared to the method of FIG.

図8に示す構成の階層符号化部による符号化では,拡張レイヤが基本レイヤの2倍の解像度を持つように階層符号化する。図6に示す階層符号化部との違いは,入力映像251を,例えば1/2というような所定の縮小率に応じて縮小する画像縮小部252が,予測画像との差分を算出する減算器253の前に設けられていること,および拡張レイヤの符号化の際に,縮小された基本レイヤの復号画像を元のサイズに拡大する画像拡大部259が,逆DCT部258と減算器260との間に設けられていることである。  In the encoding by the hierarchical encoding unit configured as shown in FIG. 8, hierarchical encoding is performed so that the enhancement layer has a resolution twice that of the base layer. A difference from the hierarchical encoding unit shown in FIG. 6 is that animage reduction unit 252 that reduces theinput video 251 in accordance with a predetermined reduction ratio such as 1/2, for example, calculates a difference from the predicted image. Animage enlarging unit 259 for enlarging the decoded image of the reduced base layer to the original size at the time of encoding of the enhancement layer, and theinverse DCT unit 258, thesubtractor 260, It is provided between.

画像縮小部252は,図8(B)に示すように,入力映像251の1フレームの縦横の画素数を例えば半分に縮小し,その縮小画像251aを基本レイヤの符号化に用いる。拡張レイヤの符号化では,縮小画像251aを符号化してそれをローカルデコードしたものを,画像拡大部259によって元の入力映像251の画像サイズに拡大し,その拡大した復号画像251bと入力映像251との差分を算出して符号化する。すなわち,図8に示す方式の階層符号化では,入力映像251を例えば半分の解像度にしたものを基本レイヤの符号化に用いる。拡張レイヤの符号化では,基本レイヤの単純拡大画像と,入力映像251の原画像との差分を符号化する。  As shown in FIG. 8B, theimage reduction unit 252 reduces the number of vertical and horizontal pixels of one frame of theinput video 251 to, for example, half, and uses the reducedimage 251a for encoding the base layer. In the encoding of the enhancement layer, the reducedimage 251a encoded and locally decoded is enlarged to the image size of theoriginal input video 251 by theimage enlargement unit 259, and the enlarged decodedimage 251b,input video 251 and The difference is calculated and encoded. That is, in the hierarchical encoding of the scheme shown in FIG. 8, theinput video 251 having a half resolution is used for encoding the base layer. In the encoding of the enhancement layer, the difference between the simple enlarged image of the base layer and the original image of theinput video 251 is encoded.

図8の階層符号化方式により階層符号化されたビットストリームを復号するクライアント端末(受信側)2’では,階層復号部26において,基本レイヤの復号画像を2倍に拡大し,拡張レイヤの復号データと重ね合わせる。  In the client terminal (reception side) 2 ′ that decodes the bit stream that has been hierarchically encoded by the hierarchical encoding method of FIG. 8, thehierarchical decoding unit 26 doubles the decoded image of the base layer and decodes the enhancement layer Overlay with data.

図8に示す階層符号化方式を用いることの利点は,基本レイヤビットストリーム11のデータ量を大きく削減することができることである。この結果,同一のビットレートで符号化ビットストリームを送信する場合に,基本レイヤビットストリーム11のデータ量が少なくなる分だけ,拡張レイヤビットストリーム12のデータ量を増加させることができるようになる。基本レイヤだけの復号画像の表示では,解像度が半分になるため画質が劣化するが,拡張レイヤを用いて階層復号された結果の解像度は,実質的に拡張レイヤの解像度によって決まるため,基本レイヤの解像度を半分にしたことによる影響は少ない。  The advantage of using the hierarchical coding scheme shown in FIG. 8 is that the data amount of thebase layer bitstream 11 can be greatly reduced. As a result, when the encoded bit stream is transmitted at the same bit rate, the data amount of the enhancementlayer bit stream 12 can be increased as much as the data amount of the baselayer bit stream 11 decreases. In the display of the decoded image of only the base layer, the image quality deteriorates because the resolution is halved, but the resolution of the result of hierarchical decoding using the enhancement layer is substantially determined by the resolution of the enhancement layer. The impact of halving the resolution is small.

図9は,本実施の形態における選択的画質向上(ROI)の様子を図式化したものである。図9(A)は,基本レイヤと拡張レイヤの解像度が同じ場合の様子を示しており,図9(B)は,基本レイヤと拡張レイヤの解像度が異なり,拡張レイヤの解像度が基本レイヤの2倍の解像度の場合の様子を示している。すなわち,図9(A)は,図6または図7に示す階層符号化方式によって生成されたビットストリームを用いる場合,図9(B)は,図8に示す階層符号化方式によって生成されたビットストリームを用いる場合の例である。  FIG. 9 is a schematic diagram showing the state of selective image quality improvement (ROI) in the present embodiment. FIG. 9A shows a state where the resolution of the base layer and the enhancement layer is the same. FIG. 9B shows that the resolution of the base layer and the enhancement layer is different, and the resolution of the enhancement layer is 2 of the basic layer. The situation in the case of double resolution is shown. 9A uses the bitstream generated by the hierarchical encoding scheme shown in FIG. 6 or FIG. 7, and FIG. 9B shows the bits generated by the hierarchical encoding scheme shown in FIG. This is an example of using a stream.

例えば,クライアント端末(受信側)2’において,図9(A1)に示すようなクライアントの画像を見ているユーザが,ポインティングデバイス等によりROI選択領域41を指定すると,その部分の拡張レイヤのデータがサーバ装置1から多く送信され,図9(A2)のように,選択された領域が他の部分よりも高精細に表示される。表示方法として,全体の表示の中で一部だけを高精細に表示する方法以外に,図9(A3)に示すように,領域の一部だけを切り出して,高精細に表示する方法を用いることもできる。  For example, when a user viewing a client image as shown in FIG. 9A1 at the client terminal (reception side) 2 ′ designates theROI selection area 41 with a pointing device or the like, the data of the extension layer of that portion Are transmitted from theserver apparatus 1 in a large amount, and the selected area is displayed with higher definition than the other parts as shown in FIG. As a display method, in addition to the method of displaying only a part of the entire display with high definition, a method of cutting out only a part of the region and displaying it with high definition as shown in FIG. 9 (A3) is used. You can also.

次に,拡張レイヤの解像度が基本レイヤの2倍の解像度で階層符号化されている場合の例を,図9(B)に従って説明する。ユーザがROI選択領域41を指定していない状態では,例えば図9(B1)に示すような基本レイヤのみの復号画像が表示されているものとする。図9(B1)のクライアント画像を見ているユーザが,ポインティングデバイス等によりROI選択領域41を指定すると,拡張レイヤを含めた階層復号により,図9(B2)のように,選択された領域が高精細に表示される。このとき全体の解像度は,拡張レイヤの解像度になる。なお,図9(B3)に示すように,高精細化された領域だけをクリップして表示するような方法を用いることもできる。  Next, an example in which the resolution of the enhancement layer is hierarchically encoded at twice the resolution of the base layer will be described with reference to FIG. In a state where the user does not designate theROI selection area 41, for example, it is assumed that a decoded image of only the base layer as shown in FIG. 9 (B1) is displayed. When the user viewing the client image in FIG. 9 (B1) designates theROI selection area 41 with a pointing device or the like, the selected area is displayed as shown in FIG. 9 (B2) by hierarchical decoding including the enhancement layer. Displayed in high definition. At this time, the overall resolution is the resolution of the enhancement layer. Note that, as shown in FIG. 9 (B3), a method of clipping and displaying only a high-definition area can also be used.

以上のサーバ装置1およびクライアント端末2,2’が行う処理は,ハードウェアやファームウェアによって実現することができるだけでなく,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。  The processes performed by theserver device 1 and theclient terminals 2 and 2 ′ can be realized not only by hardware and firmware but also by a computer and a software program, and the program can be read by a computer. It can be provided by being recorded on a recording medium or via a network.

本発明の概要を説明するための図である。It is a figure for demonstrating the outline | summary of this invention.本発明を適用した4者間の通信会議システムの例を示す図である。It is a figure which shows the example of the communication conference system between four persons to which this invention is applied.本発明の実施の形態に係るサーバ装置とクライアント端末の構成例を示す図である。It is a figure which shows the structural example of the server apparatus which concerns on embodiment of this invention, and a client terminal.拡張レイヤ領域トランスコード部のフローチャートである。It is a flowchart of an enhancement layer area transcoding part.ビットレートトランスコード部のフローチャートである。It is a flowchart of a bit rate transcoding part.階層符号化部の第1の構成例を示す図である。It is a figure which shows the 1st structural example of a hierarchy encoding part.階層符号化部の第2の構成例を示す図である。It is a figure which shows the 2nd structural example of a hierarchy encoding part.階層符号化部の第3の構成例を示す図である。It is a figure which shows the 3rd structural example of a hierarchy encoding part.クライアント端末における表示画面の例を示す図である。It is a figure which shows the example of the display screen in a client terminal.

符号の説明Explanation of symbols

1 サーバ装置
2,2’ クライアント端末
10 受信バッファ
11 基本レイヤビットストリーム
12 拡張レイヤビットストリーム
13 ROI情報受信部
14 ROI切換え部
15 拡張レイヤ領域トランスコード部
16 ビットレートトランスコード部
17 送信バッファ
18 ビットレート受信部
19 ビットレート指示部
20 カメラ
21 階層符号化部
22 送信バッファ
23 ROI指示部
24 ROI情報送信部
25 受信バッファ
26 階層復号部
27 表示部
28 ビットレート送信部
40 表示画像
41 ROI選択領域
DESCRIPTION OFSYMBOLS 1Server apparatus 2, 2 'Client terminal 10Reception buffer 11 Baselayer bit stream 12 Enhancementlayer bit stream 13 ROIinformation receiving part 14ROI switching part 15 Extension layerarea transcoding part 16 Bit rate transcoding part 17Transmission buffer 18 Bitrate Reception unit 19 Bitrate instruction unit 20 Camera 21Hierarchy encoding unit 22Transmission buffer 23ROI instruction unit 24 ROIinformation transmission unit 25Reception buffer 26Hierarchy decoding unit 27Display unit 28 Bitrate transmission unit 40Display image 41 ROI selection area

Claims (11)

Translated fromJapanese
基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータの通信を行う画像通信システムにおいて,
前記データのビットレートを指示するビットレート指示手段と,
送信対象となる前記階層符号化されたデータのデータ量が,前記ビットレート指示手段により指示されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,
送信される階層符号化されたデータを復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示手段と,
前記画質向上領域指示手段により高精細に表示させる特定部分の領域の指示があった場合に,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段とを備える
ことを特徴とする画像通信システム。
In an image communication system for performing communication of hierarchically encoded data composed of a base layer bit stream and an enhancement layer bit stream,
Bit rate indicating means for indicating the bit rate of the data;
Among the layer-encoded data, the enhancement layer bit stream is set so that the data amount of the layer-encoded data to be transmitted corresponds to the data amount corresponding to the bit rate specified by the bit rate indicating means. Bit rate transcoding means for adjusting the bit rate by performing code conversion for truncating the encoded data in the order of the encoded data of the lower plane, the encoded data of the upper plane, and then the encoded data of the base layer ,
An image quality improvement region indicating means for instructing to display a region of a specific portion of an image obtained by decoding the hierarchically encoded data to be transmitted with higher definition than other portions;
When there is an instruction of a specific part area to be displayed in high definition by the image quality improvement area instruction means, before the bit rate adjustment by the bit rate transcoding means, the hierarchically encoded data to be transmitted An image communication system, comprising: an extension layer region transcoding unit that performs code conversion to reduce a data amount of encoded data corresponding to a region other than the region of the specific portion in the enhancement layer bitstream.
請求項1記載の画像通信システムにおいて,
前記階層符号化されたデータは,拡張レイヤの解像度が基本レイヤの解像度のn倍(ただしn>1)の解像度を持つデータである
ことを特徴とする画像通信システム。
The image communication system according to claim 1,
The hierarchical communication data is an image communication system characterized in that the resolution of the enhancement layer is data having a resolution n times (where n> 1) the resolution of the base layer.
複数のクライアント端末と,前記クライアント端末にネットワークを介して接続され,前記クライアント端末間の通信を制御するサーバ装置とを備え,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータを用いたテレビ会議を行う通信会議システムであって,
前記各クライアント端末は,
自端末における入力映像を階層符号化する手段と,
階層符号化されたデータを前記サーバ装置へ送信する手段と,
前記サーバ装置から階層符号化されたデータを受信する手段と,
受信した階層符号化されたデータを階層復号する手段と,
階層復号した画像を表示する手段と,
自端末が受信するデータのビットレートを前記サーバ装置へ通知する手段と,
前記階層符号化されたデータを復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示情報を前記サーバ装置へ送信する手段とを備え,
前記サーバ装置は,
前記各クライアント端末への送信対象となる前記階層符号化されたデータのデータ量が,前記クライアント端末から通知されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,
前記クライアント端末から画質向上領域指示情報を受信した場合に,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段とを備える
ことを特徴とする通信会議システム。
Hierarchically encoded data comprising a base layer bit stream and an enhancement layer bit stream, comprising a plurality of client terminals and a server device connected to the client terminals via a network and controlling communication between the client terminals A teleconferencing system for video conferencing using
Each of the client terminals is
Means for hierarchically encoding input video at the terminal;
Means for transmitting the hierarchically encoded data to the server device;
Means for receiving hierarchically encoded data from the server device;
Means for hierarchically decoding received hierarchically encoded data;
Means for displaying the hierarchically decoded image;
Means for notifying the server device of the bit rate of data received by the terminal;
Means for transmitting to the server device image quality improvement region instruction information for instructing to display a region of a specific portion of an image obtained by decoding the hierarchically encoded data at a higher definition than other portions;
The server device
Of the hierarchically encoded data, an extension is made so that the data amount of the hierarchically encoded data to be transmitted to each client terminal is a data amount suitable for the bit rate notified from the client terminal. Bit rate that adjusts the bit rate by performing code conversion that truncates the encoded data in the order of the encoded data of the lower plane of the layer bitstream to the encoded data of the upper plane and then the encoded data of the base layer Transcoding means;
When the image quality improvement region instruction information is received from the client terminal, before the bit rate is adjusted by the bit rate transcoding means, the specific layer of the enhancement layer bit stream of the hierarchically encoded data to be transmitted is specified. A communication conference system, comprising: an extension layer region transcoding unit that performs code conversion to reduce a data amount of encoded data corresponding to a region other than a partial region.
複数のクライアント端末と,前記クライアント端末にネットワークを介して接続され,前記クライアント端末間の通信を制御するサーバ装置とを備え,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータを用いたテレビ会議を行う通信会議システムであって,
前記各クライアント端末は,
自端末における入力映像を階層符号化する手段と,
階層符号化されたデータを前記サーバ装置へ送信する手段と,
前記サーバ装置から階層符号化されたデータを受信する手段と,
受信した階層符号化されたデータを階層復号する手段と,
階層復号した画像を表示する手段と,
自端末が受信するデータのビットレートを前記サーバ装置へ通知する手段とを備え,
前記サーバ装置は,
前記各クライアント端末への送信対象となる前記階層符号化されたデータのデータ量が,前記クライアント端末から通知されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,
前記階層符号化されたデータを前記クライアント端末にて復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示手段と,
前記画質向上領域指示手段により高精細に表示させる特定部分の領域の指示があった場合に,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段とを備える
ことを特徴とする通信会議システム。
Hierarchically encoded data comprising a base layer bit stream and an enhancement layer bit stream, comprising a plurality of client terminals and a server device connected to the client terminals via a network and controlling communication between the client terminals A teleconferencing system for video conferencing using
Each of the client terminals is
Means for hierarchically encoding input video at the terminal;
Means for transmitting the hierarchically encoded data to the server device;
Means for receiving hierarchically encoded data from the server device;
Means for hierarchically decoding received hierarchically encoded data;
Means for displaying the hierarchically decoded image;
Means for notifying the server device of the bit rate of data received by the terminal,
The server device
Of the hierarchically encoded data, an extension is made so that the data amount of the hierarchically encoded data to be transmitted to each client terminal is a data amount suitable for the bit rate notified from the client terminal. Bit rate that adjusts the bit rate by performing code conversion that truncates the encoded data in the order of the encoded data of the lower plane of the layer bitstream to the encoded data of the upper plane and then the encoded data of the base layer Transcoding means;
An image quality improvement region instruction means for instructing to display a region of a specific portion of an image obtained by decoding the hierarchically encoded data at the client terminal in a higher definition than other portions;
When there is an instruction of a specific part area to be displayed in high definition by the image quality improvement area instruction means, before the bit rate adjustment by the bit rate transcoding means, the hierarchically encoded data to be transmitted A communication conferencing system comprising: an extension layer region transcoding unit that performs code conversion to reduce a data amount of encoded data corresponding to a region other than the region of the specific portion of the enhancement layer bitstream.
請求項3または請求項4記載の通信会議システムにおいて,
前記クライアント端末が受信するデータのビットレートを前記サーバ装置へ通知する手段を持つ代わりに,ネットワーク上の装置または前記サーバ装置が,各クライアント端末に対して送信するデータのビットレートを決定し,前記ビットレートトランスコード手段に通知する手段を持つ
ことを特徴とする通信会議システム。
In the communication conference system according to claim 3 or 4,
Instead of having a means for notifying the server device of the bit rate of data received by the client terminal, the device on the network or the server device determines the bit rate of data to be transmitted to each client terminal, and A communication conference system comprising means for notifying a bit rate transcoding means.
請求項3,請求項4または請求項5記載の通信会議システムのクライアント端末が用いる階層符号化装置であって,
入力映像を1/n(ただしn>1)に縮小する画像縮小手段と,
前記画像縮小手段によって縮小した画像を符号化し,基本レイヤビットストリームを生成する基本レイヤ符号化手段と,
前記基本レイヤ符号化手段によって符号化したデータを復号した画像を,n倍に拡大する画像拡大手段と,
入力映像と前記画像拡大手段によって拡大した画像とを用いて,拡張レイヤビットストリームを生成する拡張レイヤ符号化手段とから構成される
ことを特徴とする階層符号化装置。
A hierarchical encoding device used by a client terminal of a communication conference system according to claim 3, claim 4 or claim 5,
Image reduction means for reducing the input video to 1 / n (where n>1);
Base layer encoding means for encoding the image reduced by the image reduction means and generating a base layer bitstream;
An image enlarging means for enlarging an image obtained by decoding the data encoded by the base layer encoding means by n times;
A hierarchical coding apparatus comprising: an enhancement layer encoding means for generating an enhancement layer bitstream using an input video and an image enlarged by the image enlargement means.
テレビ会議を行う複数のクライアント端末にネットワークを介して接続され,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータを用いたテレビ会議を制御するサーバ装置であって,
前記クライアント端末への送信対象となる前記階層符号化されたデータのデータ量が,前記クライアント端末に対して指定されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,
送信される階層符号化されたデータを前記クライアント端末にて復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示情報に基づき,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段とを備える
ことを特徴とするサーバ装置。
A server device that is connected to a plurality of client terminals performing a video conference via a network and controls a video conference using hierarchically encoded data including a base layer bit stream and an enhancement layer bit stream,
Of the hierarchically encoded data, the data amount of the hierarchically encoded data to be transmitted to the client terminal is a data amount that matches the bit rate specified for the client terminal, Bit that adjusts the bit rate by performing code conversion that truncates the encoded data in the order of the encoded data of the lower plane of the enhancement layer bitstream, the encoded data of the upper plane, and then the encoded data of the base layer Rate transcoding means;
The bit rate based on the image quality improvement region indication information that instructs to display the region of the specific portion of the image obtained by decoding the hierarchically encoded data to be transmitted at the client terminal in a higher definition than the other portion. Before the bit rate is adjusted by the transcoding means, the amount of encoded data corresponding to an area other than the specific part of the enhancement layer bit stream of the hierarchically encoded data to be transmitted is reduced. A server apparatus comprising: an enhancement layer area transcoding unit that performs code conversion.
基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータの通信を行う画像通信システムにおける画像通信方法であって,
前記データのビットレートを指示するビットレート指示過程と,
送信対象となる前記階層符号化されたデータのデータ量が,前記ビットレート指示過程において指示されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード過程と,
送信される階層符号化されたデータを復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示過程と,
前記画質向上領域指示過程により高精細に表示させる特定部分の領域の指示があった場合に,前記ビットレートトランスコード過程によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード過程とを有する
ことを特徴とする画像通信方法。
An image communication method in an image communication system for performing communication of hierarchically encoded data composed of a base layer bit stream and an enhancement layer bit stream,
A bit rate indicating process for indicating the bit rate of the data;
Of the layer-encoded data, the enhancement layer bitstream of the layer-encoded data is set so that the data amount of the layer-encoded data to be transmitted is a data amount corresponding to the bit rate indicated in the bit rate indication process. A bit rate transcoding process for adjusting the bit rate by performing code conversion for truncating the encoded data in the order of the encoded data of the lower plane, the encoded data of the upper plane, and then the encoded data of the base layer. ,
An image quality improvement region indicating process for instructing to display a region of a specific portion of an image obtained by decoding the hierarchically encoded data to be transmitted with higher definition than other portions;
When there is an instruction of a specific part area to be displayed in high definition by the image quality improvement area instruction process, before the bit rate adjustment by the bit rate transcoding process, the hierarchically encoded data to be transmitted An image communication method comprising: an enhancement layer region transcoding process for performing code conversion for reducing a data amount of encoded data corresponding to a region other than the region of the specific portion of the enhancement layer bitstream.
請求項8記載の画像通信方法において,
前記階層符号化されたデータは,拡張レイヤの解像度が基本レイヤの解像度のn倍(ただしn>1)の解像度を持つデータである
ことを特徴とする画像通信方法。
The image communication method according to claim 8,
2. The image communication method according to claim 1, wherein the hierarchically encoded data is data whose resolution of the enhancement layer is n times (where n> 1) that of the base layer.
テレビ会議を行う複数のクライアント端末にネットワークを介して接続され,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータを用いたテレビ会議を制御するサーバ装置のコンピュータに実行させるための画像通信プログラムであって,
前記クライアント端末への送信対象となる前記階層符号化されたデータのデータ量が,前記クライアント端末に対して指定されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,
送信される階層符号化されたデータを前記クライアント端末にて復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示情報に基づき,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段として,
前記コンピュータを機能させるための画像通信プログラム。
To be executed by a computer of a server device that is connected to a plurality of client terminals performing a video conference via a network and controls a video conference using hierarchically encoded data composed of a base layer bit stream and an enhancement layer bit stream An image communication program of
Of the hierarchically encoded data, the data amount of the hierarchically encoded data to be transmitted to the client terminal is a data amount that matches the bit rate specified for the client terminal, Bit that adjusts the bit rate by performing code conversion that truncates the encoded data in the order of the encoded data of the lower plane of the enhancement layer bitstream, the encoded data of the upper plane, and then the encoded data of the base layer Rate transcoding means;
The bit rate based on the image quality improvement region indication information that instructs to display the region of the specific portion of the image obtained by decoding the hierarchically encoded data to be transmitted at the client terminal in a higher definition than the other portion. Before the bit rate is adjusted by the transcoding means, the amount of encoded data corresponding to an area other than the specific part of the enhancement layer bit stream of the hierarchically encoded data to be transmitted is reduced. As an extension layer area transcoding means for code conversion,
An image communication program for causing the computer to function.
テレビ会議を行う複数のクライアント端末にネットワークを介して接続され,基本レイヤビットストリームと拡張レイヤビットストリームとからなる階層符号化されたデータを用いたテレビ会議を制御するサーバ装置のコンピュータに実行させるための画像通信プログラムを記録したコンピュータ読み取り可能な記録媒体であって,
前記クライアント端末への送信対象となる前記階層符号化されたデータのデータ量が,前記クライアント端末に対して指定されたビットレートに見合うデータ量になるように,階層符号化されたデータのうち,拡張レイヤビットストリームの下位プレーンの符号化データから上位プレーンの符号化データ,次に基本レイヤの符号化データの順番で,符号化データを切り捨てるコード変換を行うことにより,ビットレートの調整を行うビットレートトランスコード手段と,
送信される階層符号化されたデータを前記クライアント端末にて復号した画像の特定部分の領域を,他の部分よりも高精細に表示させることを指示する画質向上領域指示情報に基づき,前記ビットレートトランスコード手段によるビットレートの調整前に,送信対象となる前記階層符号化されたデータの拡張レイヤビットストリームのうち,前記特定部分の領域以外の領域に相当する符号化データのデータ量を削減するコード変換を行う拡張レイヤ領域トランスコード手段として,
前記コンピュータを機能させるためのプログラムを記録した
ことを特徴とする画像通信プログラム記録媒体。
To be executed by a computer of a server device that is connected to a plurality of client terminals performing a video conference via a network and controls a video conference using hierarchically encoded data composed of a base layer bit stream and an enhancement layer bit stream A computer-readable recording medium recording the image communication program of
Of the hierarchically encoded data, the data amount of the hierarchically encoded data to be transmitted to the client terminal is a data amount that matches the bit rate specified for the client terminal, Bit that adjusts the bit rate by performing code conversion that truncates the encoded data in the order of the encoded data of the lower plane of the enhancement layer bitstream, the encoded data of the upper plane, and then the encoded data of the base layer Rate transcoding means;
The bit rate based on the image quality improvement region indication information that instructs to display the region of the specific portion of the image obtained by decoding the hierarchically encoded data to be transmitted at the client terminal in a higher definition than the other portion. Before the bit rate is adjusted by the transcoding means, the amount of encoded data corresponding to an area other than the specific part of the enhancement layer bit stream of the hierarchically encoded data to be transmitted is reduced. As an extension layer area transcoding means for code conversion,
An image communication program recording medium, wherein a program for causing the computer to function is recorded.
JP2004155421A2004-05-262004-05-26 Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording mediumExpired - LifetimeJP3936708B2 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP2004155421AJP3936708B2 (en)2004-05-262004-05-26 Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP2004155421AJP3936708B2 (en)2004-05-262004-05-26 Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium

Publications (2)

Publication NumberPublication Date
JP2005341076Atrue JP2005341076A (en)2005-12-08
JP3936708B2 JP3936708B2 (en)2007-06-27

Family

ID=35494151

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP2004155421AExpired - LifetimeJP3936708B2 (en)2004-05-262004-05-26 Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium

Country Status (1)

CountryLink
JP (1)JP3936708B2 (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2008131321A (en)*2006-11-212008-06-05Nippon Telegr & Teleph Corp <Ntt> Video transmission method, video transmission program, and computer-readable recording medium recording the program
WO2009035012A1 (en)*2007-09-102009-03-19Fujifilm CorporationImage processing apparatus, image processing method, and program
JP2010503280A (en)*2006-08-292010-01-28マイクロソフト コーポレーション Visual composition management technology for multimedia audio conferencing
US8036476B2 (en)2006-10-182011-10-11Realtek Semiconductor Corp.Image encoding/decoding device and method thereof with data blocks in a determined order
JP2013048356A (en)*2011-08-292013-03-07Ricoh Co LtdTv conference system, video distribution apparatus and data processing method
JP2014514883A (en)*2011-05-112014-06-19アルカテル−ルーセント Method for dynamically adapting video image parameters to facilitate subsequent applications
JP2016504812A (en)*2012-11-202016-02-12アルカテル−ルーセント Method for sending a video stream
JP2016105593A (en)*2014-11-262016-06-09ソニー株式会社Live selective adaptive bandwidth
CN106254952A (en)*2015-06-092016-12-21维布络有限公司video quality dynamic control method and device
JP2017022529A (en)*2015-07-092017-01-26キヤノン株式会社Communication system, communication device, communication method, and program
CN106464837A (en)*2014-03-052017-02-22株式会社理光Data transmission system, terminal device, program, and method
JP2017098898A (en)*2015-11-272017-06-01キヤノン株式会社 Image encoding apparatus, control method thereof, program, and storage medium
US10771745B2 (en)2016-08-232020-09-08Nec CorporationImage processing apparatus, image processing method, and storage medium having program stored therein
JP2022532065A (en)*2019-12-302022-07-13テンセント・アメリカ・エルエルシー Methods, computer systems, and computer programs for alignment between layers in a coded video stream.
WO2023106259A1 (en)*2021-12-062023-06-15日本放送協会Delivery device and receiving device

Citations (19)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS5335313A (en)*1976-09-131978-04-01Nippon Telegr & Teleph Corp <Ntt>Picture image communication system
JPH0216887A (en)*1988-07-041990-01-19Nippon Telegr & Teleph Corp <Ntt>Picture encodor
JPH0669811A (en)*1992-08-211994-03-11Oki Electric Ind Co Ltd Encoding circuit and decoding circuit
JPH06319134A (en)*1993-05-071994-11-15Oki Electric Ind Co LtdPicture communication system
JPH0746553A (en)*1993-07-301995-02-14Canon Inc Image communication device and system
JPH07288806A (en)*1994-04-201995-10-31Hitachi Ltd Video communication system
JPH08149434A (en)*1994-11-181996-06-07Casio Comput Co Ltd Video phone
JPH0998434A (en)*1995-09-291997-04-08Toshiba Corp Image encoding device and image decoding device
JPH10271515A (en)*1997-03-261998-10-09Sanyo Electric Co LtdNoticed area tracing method, noticed area tracing device using the method and image coding method
JPH10271499A (en)*1997-03-261998-10-09Sanyo Electric Co LtdImage processing method using image area, image processing unit using the method and image processing system
JPH10304335A (en)*1997-04-281998-11-13Fujitsu Ltd Information transmission equipment
JPH10304334A (en)*1997-04-251998-11-13Canon Inc Communication method, communication device, transmitting device, receiving device, communication system, and storage medium
JPH11187371A (en)*1997-12-241999-07-09Kyocera Corp Real-time image transmission method for videophone system
JP2000152234A (en)*1998-11-162000-05-30Canon Inc Data processing apparatus and method, and data processing system
JP2000358232A (en)*1999-06-152000-12-26Toshiba Corp VOD system
JP2001069502A (en)*1999-08-252001-03-16Toshiba Corp Video transmitting terminal and video receiving terminal
JP2002084524A (en)*2000-09-062002-03-22Nippon Telegr & Teleph Corp <Ntt> Video / audio / data broadcast receiving / encoding / recording / transmission method and broadcast recording / playback server device
JP2003174645A (en)*2001-11-302003-06-20Inst For Information Industry Wavelet transform processing method for video images
JP2004023732A (en)*2002-06-202004-01-22Matsushita Electric Ind Co Ltd Data transmission device, data reception device, data transmission method, and data reception method

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS5335313A (en)*1976-09-131978-04-01Nippon Telegr & Teleph Corp <Ntt>Picture image communication system
JPH0216887A (en)*1988-07-041990-01-19Nippon Telegr & Teleph Corp <Ntt>Picture encodor
JPH0669811A (en)*1992-08-211994-03-11Oki Electric Ind Co Ltd Encoding circuit and decoding circuit
JPH06319134A (en)*1993-05-071994-11-15Oki Electric Ind Co LtdPicture communication system
JPH0746553A (en)*1993-07-301995-02-14Canon Inc Image communication device and system
JPH07288806A (en)*1994-04-201995-10-31Hitachi Ltd Video communication system
JPH08149434A (en)*1994-11-181996-06-07Casio Comput Co Ltd Video phone
JPH0998434A (en)*1995-09-291997-04-08Toshiba Corp Image encoding device and image decoding device
JPH10271515A (en)*1997-03-261998-10-09Sanyo Electric Co LtdNoticed area tracing method, noticed area tracing device using the method and image coding method
JPH10271499A (en)*1997-03-261998-10-09Sanyo Electric Co LtdImage processing method using image area, image processing unit using the method and image processing system
JPH10304334A (en)*1997-04-251998-11-13Canon Inc Communication method, communication device, transmitting device, receiving device, communication system, and storage medium
JPH10304335A (en)*1997-04-281998-11-13Fujitsu Ltd Information transmission equipment
JPH11187371A (en)*1997-12-241999-07-09Kyocera Corp Real-time image transmission method for videophone system
JP2000152234A (en)*1998-11-162000-05-30Canon Inc Data processing apparatus and method, and data processing system
JP2000358232A (en)*1999-06-152000-12-26Toshiba Corp VOD system
JP2001069502A (en)*1999-08-252001-03-16Toshiba Corp Video transmitting terminal and video receiving terminal
JP2002084524A (en)*2000-09-062002-03-22Nippon Telegr & Teleph Corp <Ntt> Video / audio / data broadcast receiving / encoding / recording / transmission method and broadcast recording / playback server device
JP2003174645A (en)*2001-11-302003-06-20Inst For Information Industry Wavelet transform processing method for video images
JP2004023732A (en)*2002-06-202004-01-22Matsushita Electric Ind Co Ltd Data transmission device, data reception device, data transmission method, and data reception method

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FERNANDO PEREIRA, TOURADJ EBRAHIMI, THE MPEG-4 BOOK, JPN4006012343, 10 July 2002 (2002-07-10), pages 330 - 343, ISSN: 0000756402*
FERNANDO PEREIRA, TOURADJ EBRAHIMI, THE MPEG-4 BOOK, JPNX007014042, 10 July 2002 (2002-07-10), pages 330 - 343, ISSN: 0000830294*
三木弼一編著, 多彩な映像、音声を自在に符号化する MPEG−4のすべて, JPN4006012342, 30 September 1998 (1998-09-30), pages 254 - 260, ISSN: 0000756403*
三木弼一編著, 多彩な映像、音声を自在に符号化する MPEG−4のすべて, JPNX007014043, 30 September 1998 (1998-09-30), pages 254 - 260, ISSN: 0000830295*

Cited By (25)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
US9635314B2 (en)2006-08-292017-04-25Microsoft Technology Licensing, LlcTechniques for managing visual compositions for a multimedia conference call
JP2010503280A (en)*2006-08-292010-01-28マイクロソフト コーポレーション Visual composition management technology for multimedia audio conferencing
US8773494B2 (en)2006-08-292014-07-08Microsoft CorporationTechniques for managing visual compositions for a multimedia conference call
US10187608B2 (en)2006-08-292019-01-22Microsoft Technology Licensing, LlcTechniques for managing visual compositions for a multimedia conference call
US8036476B2 (en)2006-10-182011-10-11Realtek Semiconductor Corp.Image encoding/decoding device and method thereof with data blocks in a determined order
JP2008131321A (en)*2006-11-212008-06-05Nippon Telegr & Teleph Corp <Ntt> Video transmission method, video transmission program, and computer-readable recording medium recording the program
WO2009035012A1 (en)*2007-09-102009-03-19Fujifilm CorporationImage processing apparatus, image processing method, and program
US8498483B2 (en)2007-09-102013-07-30Fujifilm CorporationImage processing apparatus, image processing method, and computer readable medium
JP2014514883A (en)*2011-05-112014-06-19アルカテル−ルーセント Method for dynamically adapting video image parameters to facilitate subsequent applications
JP2013048356A (en)*2011-08-292013-03-07Ricoh Co LtdTv conference system, video distribution apparatus and data processing method
JP2016504812A (en)*2012-11-202016-02-12アルカテル−ルーセント Method for sending a video stream
US10250652B2 (en)2014-03-052019-04-02Ricoh Company, LimitedData transmission system, terminal device, program, and method
CN106464837A (en)*2014-03-052017-02-22株式会社理光Data transmission system, terminal device, program, and method
EP3116222A4 (en)*2014-03-052017-02-22Ricoh Company, LimitedData transmission system, terminal device, program, and method
JP2016105593A (en)*2014-11-262016-06-09ソニー株式会社Live selective adaptive bandwidth
US9554085B2 (en)*2015-06-092017-01-24Wipro LimitedMethod and device for dynamically controlling quality of a video
CN106254952A (en)*2015-06-092016-12-21维布络有限公司video quality dynamic control method and device
CN106254952B (en)*2015-06-092020-03-10维布络有限公司Video quality dynamic control method and device
JP2017022529A (en)*2015-07-092017-01-26キヤノン株式会社Communication system, communication device, communication method, and program
JP2017098898A (en)*2015-11-272017-06-01キヤノン株式会社 Image encoding apparatus, control method thereof, program, and storage medium
US10771745B2 (en)2016-08-232020-09-08Nec CorporationImage processing apparatus, image processing method, and storage medium having program stored therein
JP2022532065A (en)*2019-12-302022-07-13テンセント・アメリカ・エルエルシー Methods, computer systems, and computer programs for alignment between layers in a coded video stream.
JP7223169B2 (en)2019-12-302023-02-15テンセント・アメリカ・エルエルシー Method, computer system, and computer program for alignment between layers in encoded video streams
WO2023106259A1 (en)*2021-12-062023-06-15日本放送協会Delivery device and receiving device
EP4447461A4 (en)*2021-12-062025-08-20Japan Broadcasting Corp DISPENSING DEVICE AND RECEIVING DEVICE

Also Published As

Publication numberPublication date
JP3936708B2 (en)2007-06-27

Similar Documents

PublicationPublication DateTitle
KR100440953B1 (en)Method for transcoding of image compressed bit stream
JP5089658B2 (en) Transmitting apparatus and transmitting method
JP4160278B2 (en) Scalable encoding method of media stream, scalable encoder, and multimedia terminal
JP3936708B2 (en) Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium
EP1638333A1 (en)Rate adaptive video coding
US20030023982A1 (en)Scalable video encoding/storage/distribution/decoding for symmetrical multiple video processors
US20070285500A1 (en)Method and Apparatus for Video Mixing
US20090168880A1 (en)Method and Apparatus for Scalably Encoding/Decoding Video Signal
US6987889B1 (en)System and method for dynamic perceptual coding of macroblocks in a video frame
JP2022514513A (en) Split tiles and sub-images
JP2005524304A (en) Method and apparatus for displaying quantizer parameters in a video coding system
JP3936707B2 (en) Scalable communication conference system, server device, scalable communication conference method, scalable communication conference control method, scalable communication conference control program, and program recording medium thereof
JP2007507927A (en) System and method combining advanced data partitioning and efficient space-time-SNR scalability video coding and streaming fine granularity scalability
JPH10178639A (en) Image codec and image data encoding method
EP1227684A2 (en)Encoding of video signals
US6864909B1 (en)System and method for static perceptual coding of macroblocks in a video frame
JP2024019620A (en) Event-based trigger interval in RTCP viewport signaling for immersive videoconferencing and telepresence for remote terminals
US11711492B2 (en)Signaling of the RTCP viewport feedback for immersive teleconferencing and telepresence for remote terminals
US20060120454A1 (en)Method and apparatus for encoding/decoding video signal using motion vectors of pictures in base layer
JP2005045666A (en) Transcoder
JP4241463B2 (en) Image processing device
US20070242747A1 (en)Method and apparatus for encoding/decoding a first frame sequence layer based on a second frame sequence layer
JP2008011191A (en) Video coding / synthesizing apparatus, video coding / synthesizing method, and video transmission system
HK40067907A (en)Video signal transmission method, device, computer equipment and storage medium
US20060133498A1 (en)Method and apparatus for deriving motion vectors of macroblocks from motion vectors of pictures of base layer when encoding/decoding video signal

Legal Events

DateCodeTitleDescription
A131Notification of reasons for refusal

Free format text:JAPANESE INTERMEDIATE CODE: A131

Effective date:20060725

A521Request for written amendment filed

Free format text:JAPANESE INTERMEDIATE CODE: A523

Effective date:20060925

RD04Notification of resignation of power of attorney

Free format text:JAPANESE INTERMEDIATE CODE: A7424

Effective date:20060925

TRDDDecision of grant or rejection written
A01Written decision to grant a patent or to grant a registration (utility model)

Free format text:JAPANESE INTERMEDIATE CODE: A01

Effective date:20070320

A61First payment of annual fees (during grant procedure)

Free format text:JAPANESE INTERMEDIATE CODE: A61

Effective date:20070323

R150Certificate of patent or registration of utility model

Ref document number:3936708

Country of ref document:JP

Free format text:JAPANESE INTERMEDIATE CODE: R150

Free format text:JAPANESE INTERMEDIATE CODE: R150

RD02Notification of acceptance of power of attorney

Free format text:JAPANESE INTERMEDIATE CODE: R3D02

FPAYRenewal fee payment (event date is renewal date of database)

Free format text:PAYMENT UNTIL: 20110330

Year of fee payment:4

FPAYRenewal fee payment (event date is renewal date of database)

Free format text:PAYMENT UNTIL: 20110330

Year of fee payment:4

FPAYRenewal fee payment (event date is renewal date of database)

Free format text:PAYMENT UNTIL: 20120330

Year of fee payment:5

FPAYRenewal fee payment (event date is renewal date of database)

Free format text:PAYMENT UNTIL: 20130330

Year of fee payment:6

S531Written request for registration of change of domicile

Free format text:JAPANESE INTERMEDIATE CODE: R313531

R350Written notification of registration of transfer

Free format text:JAPANESE INTERMEDIATE CODE: R350

EXPYCancellation because of completion of term

[8]ページ先頭

©2009-2025 Movatter.jp