Movatterモバイル変換


[0]ホーム

URL:


KR20020014026A - News tracker and analysis service based on web personalization - Google Patents

News tracker and analysis service based on web personalization
Download PDF

Info

Publication number
KR20020014026A
KR20020014026AKR1020000046899AKR20000046899AKR20020014026AKR 20020014026 AKR20020014026 AKR 20020014026AKR 1020000046899 AKR1020000046899 AKR 1020000046899AKR 20000046899 AKR20000046899 AKR 20000046899AKR 20020014026 AKR20020014026 AKR 20020014026A
Authority
KR
South Korea
Prior art keywords
news
user
information
sites
news information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
KR1020000046899A
Other languages
Korean (ko)
Inventor
김태경
Original Assignee
(주) 인포마스터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 인포마스터filedCritical(주) 인포마스터
Priority to KR1020000046899ApriorityCriticalpatent/KR20020014026A/en
Publication of KR20020014026ApublicationCriticalpatent/KR20020014026A/en
Ceasedlegal-statusCriticalCurrent

Links

Classifications

Landscapes

Abstract

Translated fromKorean

뉴스 추적 서비스 방법은, 사용자의 초기 사용 행태에 대한 로그 파일과 사용자의 개별 뉴스에 대한 적합도 평가를 종합 분석하여, 상기 사용자의 성향 및 요구 사항에 대한 정보를 추출하고 이를 사용자 프로파일에 저장하는 단계; 복수개의 뉴스 사이트에 대한 URL 주소를 저장하는 단계; 상기 저장된 URL 주소를 판독하고, 이를 기초로 상기 복수개의 뉴스 사이트들로부터 뉴스 정보들을 소정 시간마다 수집하는 단계; 수집된 뉴스 정보들을 뉴스 사이트 및 뉴스 섹션별로 분류하여 범주화된 뉴스 데이터베이스에 저장하는 단계; 상기 분류된 뉴스 정보들에 대하여 형태소 분석을 행하여 인덱스 파일을 작성하는 단계; 상기 사용자의 로그인에 응답하여, 상기 사용자 프로파일을 검색하고 상기 사용자의 요구 사항에 적합한 검색 질의어를 생성하는 단계; 상기 뉴스 데이터베이스에 저장된 뉴스 정보 중에서, 상기 검색 질의어와 일치하는 상기 인덱스 파일에 의해 참조되는 뉴스 데이터베이스 영역의 뉴스 정보만을 검색, 추출하는 단계; 및 상기 추출된 뉴스 정보를 사용자에게 전달하는 단계를 포함한다. 사용자는 자신에게 필요한 뉴스 정보를 얻게 위하여 별도의 뉴스 검색 과정을 거칠 필요가 없고, 로그인과 동시에 웹 화면, 전자 우편, 휴대 전화 등으로 뉴스 추적 서비스 서버에 의해 검색, 추출된 사용자 관련 뉴스를 받아 볼 수 있게 된다.The news tracking service method comprises the steps of: comprehensively analyzing a log file of the user's initial usage behavior and a fitness evaluation of the user's individual news, extracting information on the user's propensity and requirements, and storing the information in the user profile; Storing URL addresses for the plurality of news sites; Reading the stored URL address and collecting news information every predetermined time from the plurality of news sites based on the stored URL address; Classifying the collected news information by news site and news section and storing the classified news information in a categorized news database; Generating an index file by performing morphological analysis on the classified news information; Responsive to login of the user, retrieving the user profile and generating a search query suitable for the user's requirements; Searching and extracting only news information of a news database area referred to by the index file matching the search query, from news information stored in the news database; And delivering the extracted news information to a user. Users do not have to go through a separate news search process to get the news information they need, and they can receive user-related news retrieved and extracted by the news tracking service server through web screen, e-mail, and mobile phone at the same time as login. It becomes possible.

Description

Translated fromKorean
웹 개인화에 바탕한 뉴스 추적 및 분석 서비스{NEWS TRACKER AND ANALYSIS SERVICE BASED ON WEB PERSONALIZATION}News tracking and analysis service based on web personalization {NEWS TRACKER AND ANALYSIS SERVICE BASED ON WEB PERSONALIZATION}

본 발명은 웹 기반의 개인화된 뉴스 서비스에 관한 것으로, 보다 구체적으로는 국내 및 전 세계 주요 뉴스 사이트에서 제공하는 다양한 뉴스 정보를 실시간으로 검색하여 사용자의 요구에 맞추어 개별화된 맞춤 뉴스 서비스를 제공하는 방법에 관한 것이다.The present invention relates to a web-based personalized news service, and more particularly, a method of providing a personalized news service personalized to a user's needs by searching in real time for various news information provided by major news sites in Korea and around the world. It is about.

인터넷을 통한 정보 유통 시장이 급격히 팽창함에 따라, 기존의 오프라인상의 주요 언론사들은 자체 웹사이트를 구축하여 이를 통해 온라인 뉴스 서비스를 제공하고 있으며, 나아가 최근에는 몇몇 전문 분야의 뉴스에 대한 온라인 뉴스 서비스만을 제공하는 뉴스 사이트들도 급속하게 증가하고 있는 추세이다. 더욱이 이들 뉴스 사이트에 대한 검색이나 메타 검색을 통해 주요 뉴스를 발췌하여 제공하는 서비스까지 합칠 때, 사용자들은 이와 같은 엄청난 양의 뉴스 정보들을 망라적으로 검토하여 자신이 원하는 뉴스 정보만을 추출하여 읽어 보기가 용이하지 않다.With the rapid expansion of the information distribution market via the Internet, major offline media outlets have established their own websites to provide online news services, and more recently, only online news services for news in a few specialized fields. News sites are also increasing rapidly. What's more, when combined with services that extract and deliver key news from search or meta-search on these news sites, users are forced to review this huge amount of news information to extract and read only the news information they want. Not easy

이런 측면에서, 여러 사이트에서 제공하는 뉴스중에서 사용자의 관심 분야의 뉴스만을 제공하기 위한 인터넷 맞춤 뉴스 서비스가 여러가지 형태로 제공되고 있다. 인터넷상에서의 이러한 맞춤 뉴스 서비스는 크게 두 가지 유형으로 분류될 수 있다. 그 중 하나는 뉴스 서비스 제공자가 뉴스 정보를 몇 가지의 범주로 분류하여 제공하면서, 사용자에게 스스로 원하는 뉴스 정보의 범주를 선택하게 함으로써 그 범주의 뉴스를 제공하는 방식이며, 다른 하나는 사용자가 원하는 뉴스 정보에 대한 검색을 질의어를 사용하여 요청하면, 그 검색 결과를 사용자에게 전달하는 방식이다.In this regard, among the news provided by various sites, an Internet customized news service for providing only the news of the user's interest is provided in various forms. These personalized news services on the Internet can be classified into two types. One is to provide news service providers with news information categorized into several categories, and to provide users with the category of news information that they want, and the other is news that users want. When a search for information is requested using a query word, the search result is transmitted to a user.

그러나, 이들 기존의 두 가지 맞춤 서비스 방식 모두는 제한점을 가지고 있다. 우선, 전자의 방법의 경우에는, 뉴스 서비스 제공자의 심성 모형에 기초한 분류 범주가 모든 사용자 개개인의 요구 수준에 맞는 적합한 분류 범주가 될 수는 없을 뿐만 아니라, 사용자의 입장에서는 상황에 따라 서비스 제공자가 제시한 분류 범주중 자신이 선택하지 않은 범주의 뉴스 정보도 필요로 할 때도 있으므로, 결국 사용자는 모든 상황에서 자신이 원하는 뉴스 정보를 얻기 위해서는 뉴스 정보를 망라적으로 탐색할 수밖에 없다. 한편, 후자의 경우는, 사용자가 자신이 원하는 뉴스의 내용을 분명히 알고 있을 때는 비교적 관련 뉴스를 망라적으로 제공해줄 수 있지만(물론, 이 경우에도 뉴스 검색 결과의 정확도를 높이기 위해서는 아주 복잡하고 세밀한 질의어를 사용자가 직접 작성하여만 하므로, 이에 따른 사용자의 불편과 검색 시간이 증가하게 됨), 일반적으로 사용자들은 자신이 몰랐던 새로운 정보를 얻기 위해 뉴스 서비스를 받는다는 점에서 후자의 방법 역시 제한적일 수 밖에 없다.However, both of these existing custom service methods have limitations. First of all, in the former method, the classification category based on the news service provider's mental model may not be a suitable classification category that meets the level of needs of every individual user. Since a user may also need news information of a category not selected by one of the classification categories, the user has no choice but to search the news information in order to obtain the news information he / she wants in all situations. On the other hand, in the latter case, when the user clearly knows the content of the news he wants, it can provide relatively relevant news (also, in this case, a very complicated and detailed query to improve the accuracy of the news search results). Since the user only needs to write his / her own information, the user's inconvenience and retrieval time increase accordingly). In general, the latter method is also limited in that the user receives a news service to obtain new information that he did not know.

더욱이, 상술한 두 가지 유형의 서비스 모두 국내나 국외의 제한적인 뉴스 사이트만을 검색 대상으로 하고 있으며, 이러한 검색 역시 실시간 검색이 아니므로, 이들 서비스를 통해서는 사용자가 자신이 관심을 갖는 정보에 대해 실시간으로 서로 다른 사이트들로부터 제공되는 뉴스를 비교하여 검토하는 것이 거의 불가능하다.Moreover, both types of services described above are targeted only to limited news sites, both domestic and international. Since these searches are not real-time searches, they provide real-time information on the information that users are interested in. It is almost impossible to review and compare news from different sites.

이에, 사용자가 실시간으로 망라적인 뉴스 정보를 제공받으면서 또한 그 중에서 자신이 관심을 갖고 있거나 필요한 정보를 효율적으로 정리해서 제공받는 지능적인 맞춤형 뉴스 서비스에 대한 필요성이 대두되고 있다.Accordingly, there is a need for an intelligent customized news service in which a user is provided with comprehensive news information in real time and also efficiently organizes and provides information of interest or necessary among them.

본 발명은 이러한 종래 맞춤 뉴스 서비스 방법의 한계 및 문제점을 보완하여, 지능적인 일대일 맞춤형 뉴스 서비스 방법을 제공하는 것을 그 목적으로 한다.The present invention aims to provide an intelligent one-to-one customized news service method by supplementing the limitations and problems of the conventional customized news service method.

따라서, 본 발명의 목적은 사용자에게 제공되는 뉴스 제공원을 국내외 모든 주요 뉴스 사이트들로 하고 이들 사이트들에서 제공되는 모든 정보들을 각각의 섹션별로 개별적인 웹 화면상에 나타낼 수 있도록 함으로써, 동일한 이슈에 대한 뉴스 사이트들의 보도 경향을 비교 검토할 수 있는 뉴스 서비스를 제공하는 것이다.Accordingly, an object of the present invention is to provide a news source provided to the user to all the major news sites at home and abroad, and to display all the information provided from these sites on a separate web screen for each section. It is to provide news service that can compare and examine news trends of news sites.

본 발명의 또 다른 목적은, 뉴스의 중요한 기능중 하나인 속보성을 최대한 살려, 최소 매 5분마다 주요 국내외 뉴스 사이트들의 새로운 뉴스들을 지능적 에이전트(스파이더 서버)를 이용해서 수집 분류함으로써, 실시간의 뉴스 서비스를 제공하는 것이다.Another object of the present invention is to make real-time news by collecting and classifying new news of major domestic and foreign news sites by using intelligent agent (spider server) at least every 5 minutes, taking full advantage of breaking news, which is an important function of news. To provide services.

본 발명의 또 다른 목적은, 국내외 뉴스 사이트에 게재된 정보중에서 사용자의 관심이나 요구에 부합하는 뉴스를 별도로 분류하여 사용자의 뉴스 검색 취향에 맞추어 제공함으로써, 사용자 개개인의 사용 편의성을 최대한 살린 맞춤형 뉴스 서비스를 제공하는 것이다.Another object of the present invention is to provide a news service that caters to the user's news search preferences by separately classifying news that meets the user's interests or needs from information published on domestic and overseas news sites, thereby providing customized news services that maximize the convenience of individual users. To provide.

마지막으로 본 발명의 또 다른 목적은, 사용자 관련/요구 뉴스의 보도 내용에 대한 시계열적이고 심층적인 내용 분석을 텍스트 마이닝 기법을 활용해 분석 제공함으로써, 사용자가 관심 뉴스 정보의 검토와 관련된 의사 결정을 신속하고 효율적으로 할 수 있도록 지원하는 뉴스 서비스를 제공하는 것이다.Finally, another object of the present invention is to provide a time-series and in-depth analysis of the contents of user-related / required news analysis using text mining techniques, so that the user can quickly make a decision related to reviewing news information of interest. It is to provide a news service to help you do it efficiently.

도 1은 본 발명에 따른 뉴스 서비스 시스템의 구조를 도시한 도면.1 is a diagram showing the structure of a news service system according to the present invention;

도 2는 도 1의 뉴스 파싱/인덱싱 프로그램에 의해 수행되는 작업 과정의 상세 흐름도.FIG. 2 is a detailed flow chart of the work performed by the news parsing / indexing program of FIG.

도 3은 본 발명에 따른 뉴스 서비스 과정의 전체 흐름도.3 is an overall flow diagram of a news service process in accordance with the present invention.

도 4는 본 발명에 따른 뉴스 기본 서비스의 기본적 웹 화면의 일례를 도시한 도면.4 is a diagram illustrating an example of a basic web screen of a news basic service according to the present invention;

도 5는 본 발명에 따른 뉴스 추적 서비스의 기본적 웹 화면의 일례를 도시한 도면.5 illustrates an example of a basic web screen of a news tracking service according to the present invention.

도 6은 본 발명에 따른 뉴스 분석 서비스중 교차 분석 결과의 일례를 도시한 도면.6 is a diagram illustrating an example of a cross-analysis result in a news analysis service according to the present invention.

도 7은 본 발명에 따른 뉴스 분석 서비스중 군집 분석 결과의 일례를 도시한 도면.7 is a view showing an example of a cluster analysis result of the news analysis service according to the present invention.

도 8은 본 발명에 따른 뉴스 분석 서비스중 의미망 구조 분석 결과의 일례를 도시한 도면.8 is a diagram showing an example of a semantic network structure analysis result of the news analysis service according to the present invention.

본 발명은 크게 세 영역으로 구분된다. 첫째, 복수개의 뉴스 사이트로부터 제공되는 뉴스 정보를 실시간으로 수집해서 정리, 분류하여 데이타베이스에 저장하는 영역과, 둘째, 데이타베이스에 저장된 뉴스들을 사용자의 성향이나 요구에 맞추어 맞춤형 서비스로 제공하는 영역과, 셋째, 사용자의 관심 뉴스에 대한 정량적이고 심층적인 분석 서비스를 제공하는 영역이다.The present invention is largely divided into three areas. First, the area that collects, organizes and classifies the news information provided from a plurality of news sites in real time, and stores it in the database. Second, the area provides news customized to the user's disposition or demand. Third, it is an area that provides a quantitative and in-depth analysis of the user's news of interest.

첫 번째 영역은, 다시 다음과 같은 세부 단계로 구성되는 뉴스 서비스로, 180여개 이상의 국내외 주요 뉴스 사이트에 대한 URL 주소를 저장하는 단계, 지능적 에이전트(스파이더 서버)가 상기 저장된 URL 주소를 판독하고, 이를 기초로 상기 URL을 실시간으로 검색하여 갱신된 뉴스 정보를 선별, 수집하는 단계, 수집된 뉴스 정보들을 뉴스 사이트 및 뉴스 섹션별로 내용을 분류하여 범주화된 뉴스 데이터베이스에 저장하는 단계, 사용자의 로그인에 응답하여, 상기 분류/저장된 뉴스 정보를 검색하고 추출하는 단계, 복수개의 뉴스 섹션으로 구분된 형태로 사용자의 웹 화면을 구성하고, 상기 추출된 뉴스 정보들을 사용자 웹 화면상에 대응되는 각각의 영역으로 매칭시켜 표시함으로써, 하나의 뉴스 섹션에 포함되는 복수개의 뉴스 사이트로부터의 뉴스 정보들이 하나의 웹 화면상에서 동시에 표시될 수 있도록 하는 단계를 포함하는 뉴스 서비스이다.The first area is, again, a news service consisting of the following detailed steps: storing URL addresses for more than 180 major news sites at home and abroad, and the intelligent agent (spider server) reads the stored URL addresses, and Selecting and collecting updated news information by searching the URL in real time based on the URL; classifying the collected news information into news sites and news sections and storing the classified news information in a categorized news database; Searching and extracting the classified / stored news information; constructing a web screen of the user in a form divided into a plurality of news sections, and matching the extracted news information to respective areas corresponding to the user web screen. By displaying, news information from a plurality of news sites included in one news section A news service that comprises so that it can be displayed simultaneously on one web screen.

두 번째 영역은, 복수개의 뉴스 사이트로부터 제공되는 뉴스 정보중 사용자의 요구에 적합한 뉴스 정보만을 추적하여 전달하는 뉴스 추적 서비스로서, 사용자의 초기 사용 행태에 대한 로그 파일과 사용자의 개별 뉴스에 대한 적합도 평가를 종합 분석하여, 사용자의 성향이나 요구 사항에 대한 정보를 추출하고 이를 사용자 프로파일에 저장하는 단계, 상기 범주화하여 저장된 뉴스 데이타베이스내의 뉴스 정보들에 대하여 형태소 분석을 행하여 인덱스 파일을 작성하는 단계, 사용자의 로그인에 응답하여, 상기 사용자 프로파일을 검색하고 사용자의 요구 사항에 적합한 검색 질의어를 생성하는 단계, 상기 뉴스 데이터베이스에 저장된 뉴스 정보 중에서 상기 검색 질의어와 일치하는 상기 인덱스 파일에 의해 참조되는 뉴스 데이터베이스 영역의 뉴스 정보만을 검색, 추출하는 단계, 및 상기 추출된 뉴스 정보를 사용자의 웹 화면상에 표시하는 단계의 세부 단계로 이루어진다.The second area is a news tracking service that tracks and delivers only news information that meets user needs among news information provided from a plurality of news sites, and evaluates the suitability of a log file of the user's initial usage behavior and the user's individual news. Comprehensive analysis, extracting information on the user's disposition or requirements and storing it in a user profile, stemming the news information in the categorized and stored news database to create an index file, the user Responsive to the login of the user profile, retrieving the user profile and generating a search query suitable for the user's requirements, wherein the news file stored in the news database is referenced by the index file that matches the search query. news Searching and extracting only information, and displaying the extracted news information on a user's web screen.

세 번째 영역은 사용자의 관심 뉴스에 대한 분석 서비스로서, 격주간 또는 월간 누적된 뉴스 중 사용자의 관심 영역에 대한 뉴스를 모아 보도 경향과 심층 의미 구조를 정량적으로 분석하는 서비스이다. 이는, 상기 뉴스 데이타베이스에 저장된 뉴스 정보중 사용자의 관심 뉴스들을 상기 사용자 프로파일을 참조하여 추출하는 단계, 추출된 뉴스 정보들을 격주간 또는 월간 단위로 저장하는 단계, 상기 저장된 뉴스들을 격주간 또는 월간 마다 분석을 위한 데이타로 변환하는 단계, 상기 변환된 데이타를 사용자의 요구에 적합한 차원별로 교차 집계표를 생성하는 단계, 상기 변환된 데이타에 포함된 뉴스의 주제어들간의 연관성을 분석하여 군집화하는 단계, 상기 군집화된 자료들간의 공발생 확률을 계산하고, 이를 기초로 사용자 관심 뉴스의 의미망 구조를 생성하는 단계, 상기 생성된 의미망 구조를 그림으로 표현하여 사용자의 웹 화면에 표시하는 세부 단계들로 이루어진다.The third area is an analysis service for news of interest of the user. The third area is a service for quantitatively analyzing news trends and in-depth semantic structures by gathering news of the user's interest of biweekly or monthly accumulated news. This method includes extracting news of interest of a user from among news information stored in the news database with reference to the user profile, storing extracted news information every other week or monthly, and storing the stored news every other week or every month. Converting the converted data into data for analysis, generating a cross-aggregate table for each dimension suitable for a user's request, analyzing and grouping correlations between key words of news included in the converted data; Computing the probability of occurrence of the generated data, and based on this, generating a semantic network structure of the user interest news, and the detailed steps of displaying the generated semantic network structure in a picture to display on the user's web screen.

이하에 첨부된 도면을 참조하여 본 발명의 실시예를 중심으로 상세히 설명하기로 한다.Hereinafter, exemplary embodiments will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 뉴스 서비스 시스템의 아키텍쳐를 전체적으로 도시한 도면이다. 도시된 바와 같이 본 발명에 따른 뉴스 클리핑 서버(100)는, 복수개의 데이타 저장 유닛(101, 102, 103 및 104)과 이들 저장 유닛에 저장된 데이타들을 이용하거나 이들 데이타들을 적절히 가공하는 복수개의 프로그램 유닛(105, 106, 107, 108 및 109)으로 구성된다.1 is a diagram showing the overall architecture of a news service system according to the present invention. As shown, the news clipping server 100 according to the present invention uses a plurality of data storage units 101, 102, 103, and 104 and a plurality of program units that use data stored in these storage units or appropriately process these data. (105, 106, 107, 108 and 109).

상기 복수개의 저장 유닛중 URL 목록 저장 유닛(101)은 국내 및 국외의 뉴스 사이트들에 대한 URL 파일들을 저장한다. 뉴스 클리핑 서버(100)내의 뉴스 클리핑 프로그램(105)은 이 URL 목록 저장 유닛(101)에 저장된 URL 파일을 이용하여 각 뉴스 사이트로부터 각 뉴스 기사에 대한 HTLM 페이지를 수집(crawling)한다. 본 발명의 한 실시예에 따르면, URL 목록 저장 유닛(101)은 국내 및 국외의 180여개 뉴스 사이트에 대한 URL 주소를 저장하고 있으며, 뉴스 클리핑 프로그램(105)은 이들 뉴스 사이트들에 대해 최소 5분 단위마다 뉴스 정보를 끌어 모은다. 따라서, 본 발명은 국내 또는 국외의 한정된 일부 뉴스 사이트만을 뉴스 제공원으로 하고 있는 종래의 뉴스 클리핑 서비스에 비하여 한층 다양한 뉴스 정보를 사용자에게 제공할 수 있을 뿐만 아니라, 이하에서 설명할 개인화된 웹 페이지 디스플레이 방식을 채택함으로써 사용자 관련 기사를 보도하고 있는 국내 및 해외 뉴스 사이트들간의 비교 읽기도 가능하게 하며, 또 이와 같은 뉴스 정보들을 보도되는 즉시 사용자에게 전달하게 함으로써 실시간 뉴스 서비스를 제공할 수 있게 한다.The URL list storage unit 101 of the plurality of storage units stores URL files for domestic and foreign news sites. The news clipping program 105 in the news clipping server 100 collects HTLM pages for each news article from each news site using the URL file stored in this URL list storage unit 101. According to one embodiment of the present invention, the URL list storage unit 101 stores URL addresses for about 180 news sites in and outside the country, and the news clipping program 105 is at least 5 minutes for these news sites. Collect news information by unit. Accordingly, the present invention not only provides a variety of news information to the user, but also provides a personalized web page display which will be described below, as compared to the conventional news clipping service which has only a limited number of news sites, both domestic and foreign, as a news provider. By adopting the method, it is possible to compare and read between domestic and overseas news sites reporting user related articles, and provide such news information to users as soon as it is reported, thereby providing real-time news service.

한편, 뉴스 클리핑 프로그램(105)에 의해 수집된 각 뉴스 사이트의 뉴스 정보들은 뉴스 파싱/인덱싱 프로그램(106)을 통해 뉴스 사이트 및 섹션별로 분류되고, 분류된 뉴스 기사들의 HTLM 페이지들은 파싱 및 인덱싱 작업을 거치게 된다. 도 2는 뉴스 파싱/인덱싱 프로그램(106)에 의해 수행되는 과정에 대해서 상세히 도시하고 있다. 도 2에 도시된 바와 같이, 뉴스 파싱/인덱싱 프로그램(106)은, 단계(201)에서, 뉴스 클리핑 프로그램(105)에 의해 수집된 모든 뉴스 기사들에 대하여 뉴스 사이트 및 섹션별로 분류하여 이를 뉴스 데이타베이스(102)에 저장한다. 일반적으로 각 뉴스 사이트가 제공하는 뉴스 기사에는 고유의 URL 코드가 부여되어 있는데, 이 URL 코드에는 해당 뉴스 기사가 어떤 뉴스 사이트로부터 제공된 뉴스인 지를 구별가능케 하는 하위 분류 코드(뉴스 사이트 특정 하위 분류 코드)와, 또 이 뉴스 기사의 내용이 예를 들어 정치, 경제, 문화 또는 국제 등의 범주중 어떤 범주에 속하는 지를 결정할 수 있게 하는 하위 분류 코드(섹션 지정 하위 분류 코드)가 각각 할당되어 있다. 따라서, 뉴스 파싱/인덱싱 프로그램(105)은 이들 뉴스 기사에 대한 URL 코드의 뉴스 사이트 특정 하위 분류 코드와 섹션 지정 하위 분류 코드를 각각 참조하여, 각 뉴스 기사들을 뉴스 사이트 및 섹션별로 분류한다. 뉴스 데이타베이스(102)에 저장된 뉴스 사이트 및 섹션별로 분류된 뉴스 기사 정보들은, 이후 사용자 로그인 시에 뉴스 추출 프로그램(108)에 의해 추출되어 사용자의 웹 화면에 뉴스 사이트 및 섹션별 기사로 분류되어 표시된다.Meanwhile, news information of each news site collected by the news clipping program 105 is classified by news site and section through the news parsing / indexing program 106, and the HTLM pages of the classified news articles perform parsing and indexing operations. Going through. 2 illustrates in detail the process performed by the news parsing / indexing program 106. As shown in FIG. 2, the news parsing / indexing program 106, in step 201, sorts by news site and section all the news articles collected by the news clipping program 105 and divides them into news data. Stored in the base 102. Typically, news articles provided by each news site are given a unique URL code, which is a subcategory code (news site specific subclassification code) that identifies which news site the news article is from. And a sub-classification code (section designation sub-classification code) which allows to determine whether the contents of this news article belong to, for example, a category such as politics, economy, culture or international. Thus, the news parsing / indexing program 105 classifies each news article by news site and section by referring to the news site specific sub classification code and the section designation sub classification code of the URL code for these news articles, respectively. News article information categorized by news site and section stored in the news database 102 is then extracted by the news extraction program 108 at the time of user login and classified and displayed as articles by news site and section on the user's web screen. do.

도 2를 다시 참조하면, 뉴스 파싱/인덱싱 프로그램(106)은, 단계(202)에서, 사이트 및 섹션별로 분류된 각 뉴스 기사들의 HTML 페이지로부터 제목, 본문 및URL을 추출하고, 계속하여, 단계(203)에서, 추출된 제목, 본문 및 URL에 대하여 형태소 분석을 수행한다. 단계(204)에서는, 이 형태소 분석의 결과에 따라 인덱싱 작업을 수행한다. 인덱싱 작업에 의해 작성된 인덱스 파일은 라이브러리 인덱스(103)에 저장되게 되고, 저장된 인덱스 파일은 추후 사용자 프로파일(104)에 기록되어 있는 검색 키워드를 바탕으로 뉴스 데이타베이스(102)에 저장된 뉴스 정보로부터 사용자에 의해 요구된 사용자 관련 뉴스를 추출하고자 하는 경우에 참조된다. 이에 대해서는 이하에서 상세히 설명하기로 한다.Referring again to FIG. 2, the news parsing / indexing program 106 extracts, in step 202, the title, body, and URL from the HTML pages of each news article categorized by site and section, followed by step ( In step 203, morphological analysis is performed on the extracted title, body, and URL. In step 204, the indexing operation is performed according to the result of this morphological analysis. The index file created by the indexing operation is stored in the library index 103, and the stored index file is stored in the user from news information stored in the news database 102 based on a search keyword recorded in the user profile 104. It is referred to when it is desired to extract user related news required by. This will be described in detail below.

본 발명에 따르면, 크게 세 가지 유형의 뉴스 서비스가 제공된다. 하나는 중앙지, 경제지 및 주요 지방지와 같은 국내 주요 신문사 뉴스 사이트와 한국의 정치, 경제 및 사회적 변화에 주요한 영향을 미치는 미국, 일본, 중국 등 해외 뉴스 사이트들로부터 실시간으로 제공되는 뉴스들을 분야별, 신문사별, 및 지역별로 구분하여 한 화면에서 볼 수 있도록 함으로써, 동일한 이슈에 대한 신문사들간의 보도 경향의 비교 읽기가 가능하도록 하거나 전 세계 뉴스의 주요 변화와 흐름을 한 눈에 파악할 수 있도록 하는 '뉴스 기본 서비스(News Basic Service)'이고, 두번째는 국내 및 해외 뉴스중 사용자의 관심이나 성향 및 관련 뉴스만을 추적하여 섹션별로 제공하는 '뉴스 추적 서비스(News Tracker Service)' 이며, 마지막으로는 뉴스 추적 서비스에 의해 축적된 뉴스들을 격주간 혹은 매월마다 관련 뉴스의 보도 경향의 의미 구조를 분석하여 제공하는 '뉴스 분석 서비스(News Analyzer Service)'이다.According to the present invention, three types of news services are provided. One is to provide real-time news by sectors and newspapers from major domestic newspaper news sites such as central, economic and major regions, as well as overseas news sites such as the United States, Japan and China that have a major impact on Korea's political, economic and social changes. 'News Basic Service' enables users to read and compare newspaper trends on the same issue by viewing them on one screen, by region, and by region, or to grasp major changes and trends of global news at a glance. (News Basic Service), and the second is the 'News Tracker Service', which tracks users' interests, inclinations and related news among domestic and overseas news, and provides them by section. Analyzes the semantic structure of the trend of news reports related to accumulated news biweekly or monthly Is more than provide 'News Analysis Services (News Analyzer Service)' to.

사용자는 초기에 자신이 받고자 하는 서비스 유형을 선택할 수 있으며, 사용자에 의해 결정된 서비스 유형 및 사용자 관련 정보는 도 1의 뉴스 클리핑 서버(100)내의 사용자 프로파일 저장 유닛(102)에 기록된다.The user can initially select the type of service he wishes to receive, and the service type and user related information determined by the user are recorded in the user profile storage unit 102 in the news clipping server 100 of FIG.

도 1의 뉴스 커스터마이징(customizing) 프로그램(107)은 이 사용자 프로파일내에 저장된 각 사용자의 관심이나 성향 및 관련 정보로부터 검색 키워드를 추출하고, 이를 기초로 라이브러리 인덱스(103)내의 인덱스 파일을 참조함으로써, 뉴스 데이터베이스(102)에 수집된 뉴스 정보들 중에서 사용자가 필요로 하는 뉴스 정보만을 별도로 제공할 수 있게 한다.The news customizing program 107 of FIG. 1 extracts a search keyword from each user's interests or dispositions and related information stored in this user profile, and based on this, refers to the index file in the library index 103, thereby providing news. Among the news information collected in the database 102, only the news information required by the user can be provided separately.

뉴스 분석 프로그램(109)은 뉴스 커스터마이징 프로그램(107)에 의해 생성된 질의어를 통해 뉴스 추출 프로그램(108)에서 추출된 사용자 관심 뉴스 자료를 자료 분석을 위한 형태로 변환한 뒤, 이들 변환된 자료에 대한 교차 분석, 군집 분석 및 링크 분석등의 각종 통계 분석 처리를 행하여 그 분석 결과를 사용자 웹 화면을 통해 표시한다.The news analysis program 109 converts user-interested news data extracted from the news extraction program 108 into a form for data analysis through a query generated by the news customization program 107, and then, Various statistical analysis processes such as cross analysis, cluster analysis, and link analysis are performed, and the analysis results are displayed on the user web screen.

이제 도 3을 참조하여, 본 발명에 따른 뉴스 서비스 방법의 전체적인 흐름에 대해 설명하도록 한다.3, the overall flow of the news service method according to the present invention will be described.

도 3에 도시된 바와 같이, 단계(301)에서 사용자가 웹 화면으로부터 본 발명에 따른 뉴스 서비스를 제공하는 사이트로 접속한 뒤, 사용자 ID와 패스워드를 입력하여 뉴스 클리핑 서버(100)에 로그인하게 되면, 뉴스 클리핑 서버(100)는 우선 단계(302)에서, 사용자 프로파일(104)을 검색하여 로그인한 사용자가 신청한 서비스 유형이 무엇인지를 판단한다.As shown in FIG. 3, in step 301, when a user connects to a site providing a news service according to the present invention from a web screen, the user logs in to the news clipping server 100 by inputting a user ID and password. In step 302, the news clipping server 100 first searches the user profile 104 to determine what type of service the logged-in user has applied for.

만일, 로그인한 사용자가 희망하는 서비스 유형이 전술한 '뉴스 기본 서비스'라고 판단된 경우에는, 단계(303) 및 단계(304)로 차례로 진행하면서 도 1의 뉴스 추출 프로그램(108)에 의한 뉴스 데이터베이스(102)에 저장된 뉴스 정보의 추출 작업을 개시한다. 상술한 바와 같이, 뉴스 데이터베이스(102)에는 뉴스 사이트별 및 섹션별로 분류된 뉴스 정보들이 저장되어 있다. 뉴스 추출 프로그램(108)은 이들 사이트 및 섹션별로 분류된 뉴스 정보들에 대하여, 뉴스 사이트 및 섹션별로 차례대로 검색 및 추출 작업을 행한다. 이와 같이, 뉴스 사이트 및 섹션별로 검색 및 추출된 뉴스 정보들 각각은 단계(306)에서 뉴스 사이트별 및 뉴스 섹션별로 범주화된 특정한 형태의 사용자 웹 화면을 구성한다.If it is determined that the type of service desired by the logged-in user is the aforementioned "news basic service", the news database by the news extraction program 108 of FIG. 1 is sequentially progressed to steps 303 and 304. The extraction work of the news information stored in 102 is started. As described above, the news database 102 stores news information classified by news site and section. The news extracting program 108 searches and extracts the news information categorized by these sites and sections in order by news site and section. As such, each of the news information retrieved and extracted by news site and section constitutes a particular type of user web screen categorized by news site and news section in step 306.

도 4는 뉴스 기본 서비스 사용자에 대한 기본적인 웹 화면 구성의 일례를 도시하고 있다. 도 4에 도시된 바와 같이, 사용자 웹 화면은 크게 한 쪽 측면(도면상의 좌측)상에 마련된 뉴스 섹션 선택 영역(401)과 화면 중앙의 뉴스 디스플레이 영역(402)으로 구성된다. 뉴스 섹션 선택 영역(401)에는 정치, 경제, 문화, 국제, 인물/동정, 사설/칼럼 등과 같은 뉴스 정보의 각 섹션들이 메뉴화되어 나열되어 있고, 뉴스 디스플레이 영역(402)에는 복수개의 특정 뉴스 사이트 영역(403-1, 403-2, 403-3, ...)이 준비되어 있다. 사용자에 의한 도 4의 특정 섹션 메뉴 선택이 있으면, 뉴스 추출 프로그램(108)은 이에 응답하여 전술한 뉴스 정보들 중 사용자에 의해 선택된 섹션에 속하는 뉴스 정보만을 추출한 뒤, 이 추출된 섹션 뉴스 정보들에 대하여 뉴스 사이트별로 분류하여 이를 화면 중앙의 각각의 복수개의 특정 뉴스 사이트 영역으로 매핑시켜 디스플레이 한다.4 shows an example of a basic web screen configuration for a news basic service user. As shown in Fig. 4, the user web screen is largely composed of a news section selection area 401 provided on one side (left side of the drawing) and a news display area 402 in the center of the screen. In the news section selection area 401, each section of news information such as politics, economy, culture, international, person / sympathy, editorial / column, etc. is menu-listed, and the news display area 402 includes a plurality of specific news sites. Regions 403-1, 403-2, 403-3, ... are prepared. If there is a particular section menu selection of FIG. 4 by the user, the news extraction program 108 in response to extracts only the news information belonging to the section selected by the user from the above-mentioned news information, and then the extracted section news information is added to the extracted section news information. The information is classified by news sites and mapped to each of a plurality of specific news site areas in the center of the screen for display.

도 4에서는, 화면 중앙의 복수개의 뉴스 사이트 영역으로 국내 주요 신문사의 영역만이 표시되는 것으로 도시하였으나, 본 발명은 반드시 이에만 한정되는 것은 아니다. 즉, 전술한 실시예에서와 같이 URL 목록 저장 유닛(101)에 저장된 각 URL 주소의 뉴스 사이트들에 대하여 국내 뉴스 사이트와 해외 뉴스 사이트를 구분하여 이들 국내 및 해외 뉴스 사이트에 대한 디스플레이 영역(403)이 '뉴스 기본 서비스'의 각각 서로 다른 웹 화면을 통해 디스플레이되도록 할 수도 있으며, 그렇지 않고 이들 국내 및 해외 뉴스 사이트에 대한 디스플레이 영역이 하나의 웹 화면상에서 함께 디스플레이되도록 할 수도 있다.In FIG. 4, only the major domestic newspapers are displayed as a plurality of news site areas in the center of the screen, but the present invention is not limited thereto. That is, the display area 403 for the domestic and foreign news sites by dividing the domestic news site and the foreign news site with respect to the news sites of each URL address stored in the URL list storage unit 101 as in the above-described embodiment. Each of these 'news basic services' may be displayed through different web screens, or the display areas for these domestic and foreign news sites may be displayed together on one web screen.

이와 같이, 본 발명의 '뉴스 기본 서비스'에 따르면, 국내 또는 해외의 주요 뉴스 사이트에서 제공되는 모든 뉴스 정보들이 각각의 섹션별로 한 화면상에서 디스플레이 되므로, 동일한 이슈에 대한 각 신문사들의 보도 경향을 비교하여 읽거나 전세계 뉴스의 주요 변화와 흐름을 한 눈에 파악할 수 있게 된다.As such, according to the 'news basic service' of the present invention, since all news information provided from major news sites in Korea or abroad is displayed on one screen for each section, comparing the reporting tendency of each newspaper company on the same issue You will be able to read or see at a glance the major changes and trends in news around the world.

한편, 단계(302)에서 뉴스 클리핑 서버(100)가 사용자 프로파일(104)을 검색하여 로그인한 사용자의 서비스 유형을 판단한 결과, 그 서비스 유형이 전술한 '뉴스 추적 서비스'라고 판단된 경우에는, 커스터마이즈드 뉴스를 위한 질의어를 생성하는 단계인 단계(307)로 진행하여 로그인한 사용자에게 필요한 뉴스 정보만을 추출하는 작업을 개시한다. 단계(307)에서는, 뉴스 클리핑 서버(100)내의 사용자 프로파일(104)에 저장된 각 사용자의 관련 정보를 분석하여 뉴스 검색을 위한 질의어를 생성한다. 생성된 질의어는 뉴스 클리핑 프로그램(105)에 의해 수집되어 뉴스 데이터베이스(102)에 저장되어 있는 뉴스 정보들 중에서 사용자가 원하는 뉴스 정보만을 추출하기 위한 검색 키워드로써 사용된다. 본 발명에 따른 '뉴스 추적 서비스'는 이와 같은 질의어의 유형에 따라 크게 세 가지로 구분된다. 첫째, 사용자 고객의 이름을 질의어로 사용하여, 국내외 뉴스중 고객의 이름이 포함된 뉴스만을 추적하여 제공하는 '이름 추적 서비스(Name Tracker Service)'와, 둘째, 전세계 뉴스의 보도 내용 중 사용자 고객이 속해있는 기업 또는 기관의 이름이 들어가 있는 뉴스만을 추적하여 제공하는 '조직 추적 서비스(Organization Tracker Service)'와, 셋째, 사용자 고객의 이익과 관련하여 경쟁 관계에 있는 사람 또는 조직의 뉴스만을 추적하여 제공하는 '경쟁자 추적 서비스(Competitor Tracker Service)'가 그것이다. 사용자는 이들 서비스들중 일부 또는 전부를 자신의 의사에 따라 선택할 수 있다. 도 3의 단계(308)은 이 질의어를 사용한 사용자 고유 뉴스 추출 과정을 도시한 것으로서, 이 과정에서 전술한 뉴스 파싱/인덱싱 프로그램(106)에 의해서 작성된 라이브러리 인덱스 파일(103)이 참조되게 된다. 즉, 검색 키워드와 일치하는 단어가 인덱스 파일내에서 발견되면, 뉴스 데이터베이스(102)에 저장된 뉴스 정보들 중에서 이 인덱스 파일에 의해 참조되는 위치의 뉴스 정보만이 추출되게 된다. 사용자 프로파일을 분석하여 검색을 위한 질의어를 생성하고, 이를 바탕으로 인덱스 파일을 참조하여 해당 뉴스 정보를 추출하는 이상의 모든 과정은 도 1의 뉴스 커스터마이징 프로그램(107)에 의해 이루어진다.Meanwhile, when the news clipping server 100 determines the service type of the logged-in user by searching the user profile 104 in step 302, and determines that the service type is the aforementioned 'news tracking service', the news clipping server 100 determines the customization. The process proceeds to step 307, which is a step of generating a query for the news, and starts to extract only the news information necessary for the logged-in user. In step 307, related information of each user stored in the user profile 104 in the news clipping server 100 is analyzed to generate a query for news search. The generated query is used as a search keyword for extracting only the news information desired by the user from the news information collected by the news clipping program 105 and stored in the news database 102. News tracking service according to the present invention is classified into three types according to the type of query. First, the name tracker service, which uses only the name of the user's customer as a query, tracks and provides only news that includes the customer's name in domestic and overseas news. 'Organization Tracker Service', which tracks and provides only news that contains the name of the company or organization to which it belongs, and thirdly, tracks and provides only the news of people or organizations that compete with the interests of users' customers. That's the Competitor Tracker Service. The user can select some or all of these services at will. Step 308 of FIG. 3 illustrates a user-specific news extraction process using this query, in which the library index file 103 created by the above-described news parsing / indexing program 106 is referenced. That is, if a word matching the search keyword is found in the index file, only the news information of the position referenced by the index file is extracted from the news information stored in the news database 102. The above process of analyzing the user profile to generate a query word for searching and extracting the relevant news information by referring to the index file is performed by the news customizing program 107 of FIG. 1.

이상의 과정을 통해 추출된 사용자 고유 뉴스 정보들은, 단계(306)에서 소정의 포맷으로 구성된 웹 화면을 통해 사용자에게 디스플레이 된다. 도 5는 뉴스 추적 서비스 중 전술한 이름 추적 서비스 사용자에 대한 기본적인 웹 화면 구성의 일례를 도시하고 있다. 도 5에 도시된 바와 같이, 사용자 웹 화면은 크게 한 쪽 측면(도면상의 좌측)상에 마련된 질의어 표시 영역(501)과 화면 중앙의 뉴스 디스플레이 영역(502)으로 구성된다. 질의어 표시 영역(501)에는 검색 및 뉴스 추출과정에서 검색 키워드로 사용된 질의어 이름이 표시되고, 뉴스 디스플레이 영역(502)에는 이 질의어에 의해 검색된 사용자 고유 뉴스 정보들이 복수개의 뉴스 표시 영역(503-1, 503-2, 503-3, ...)으로 나뉘어 표시된다. 이들 복수개의 뉴스 표시 영역(503-1, 503-2, 503-3, ...)은 다수의 뉴스 사이트들을 지역별로 그룹핑한 영역일 수 있으며, 화면 좌측의 질의어 표시 영역(501)에는 이들 복수개의 뉴스 표시 영역에 각각 대응하는 지역이 표시될 수 있다. 기타 다른 뉴스 추적 서비스 즉, 조직 추적 서비스와 경쟁자 뉴스 추적 서비스의 기본적인 웹 화면도 도 5의 이름 추적 서비스의 웹 화면과 유사하게 구성될 수 있다.The user-specific news information extracted through the above process is displayed to the user through a web screen configured in a predetermined format in step 306. 5 shows an example of a basic web screen configuration for the above-mentioned name tracking service user of the news tracking service. As shown in Fig. 5, the user web screen is composed of a query word display area 501 provided on one side (left side of the figure) and a news display area 502 at the center of the screen. In the query display area 501, a query name used as a search keyword is displayed in a search and news extraction process, and the news display area 502 includes a plurality of news display areas 503-1 in which user-specific news information retrieved by the query word is searched. , 503-2, 503-3, ...). The plurality of news display areas 503-1, 503-2, 503-3, ... may be areas in which a plurality of news sites are grouped by region, and the plurality of news display areas 503-1, 503-2, 503-3, ... may be displayed in the query display area 501 on the left side of the screen. Regions corresponding to the news display areas may be displayed. The basic web screen of other news tracking services, namely, organization tracking service and competitor news tracking service, may also be configured similarly to the web screen of the name tracking service of FIG.

이와 같이, 본 발명의 '뉴스 추적 서비스'에 따르면, 사용자의 관심 사항에 대한 정보는 사용자 대상 설문조사나 사용자의 뉴스 읽기에 대한 로그 파일(log file) 분석을 통해 뉴스 클리핑 서버내의 사용자 프로파일에 저장되게 되고, 서버는 이러한 사용자 프로파일을 분석하여 질의어를 생성하고 이를 뉴스 검색 및 추출에 이용하며, 추출된 뉴스 정보는 웹 개인화를 통해 사용자별로 특화된 별도의 커스터마이즈드된 섹션을 통해 제공되게 되므로, 사용자는 몇 개의 뉴스 영역이 미리 서비스 제공업체에 의해 분류되고 이 중 일부를 사용자가 선택하게 하는 종래 뉴스 맞춤 서비스 방식에 비하여 보다 진정한 의미의 완벽한 일대일 맞춤 뉴스 서비스를 제공받을 수 있게 된다. 또한, 사용자는 이러한 국내외의 주요 뉴스 사이트에서 제공되는 모든 뉴스 정보들로부터 자신이 원하는 뉴스만이 추출된 웹 화면(커스터마이즈드 섹션)을 별도의 복잡한 검색어를 직접 입력할 필요없이 뉴스 클리핑 서버에 로그인함과 동시에 곧바로 볼 수 있게 되므로, 종래의 뉴스 클리핑 서비스에 비하여 검색어 입력에 따른 사용자의 불편 및 검색 시간을 현저히 줄일 수 있게 된다.As such, according to the 'news tracking service' of the present invention, information about a user's interest is stored in a user profile in a news clipping server through a user-targeted survey or a log file analysis of a user's news reading. The server analyzes this user profile to generate a query and uses it for news searching and extraction, and the extracted news information is provided through a separate customized section customized for each user through web personalization. Several news areas can be categorized by service providers in advance and provide a complete one-to-one personalized news service in a more true sense than traditional news personalized services that allow some of them to be selected by the user. In addition, the user logs in to a news clipping server on a web screen (customized section) where only the news he wants is extracted from all the news information provided by the major news sites at home and abroad, without having to directly enter complicated search terms. At the same time, since it can be viewed immediately, the user's inconvenience and search time due to a search word input can be significantly reduced as compared to the conventional news clipping service.

마지막으로, 단계(302)에서, 뉴스 클리핑 서버(100)가 사용자 프로파일(104)을 검색하여 로그인한 사용자의 서비스 유형을 판단한 결과, 그 서비스 유형이 '뉴스 분석 서비스'라고 판단한 경우에는, 전술한 단계(308)에서 소정 기간(예를 들어, 격주간 또는 월간)동안 추출되어 축적된 사용자 관련 뉴스들을 자료 분석을 위한 형태로 자료 구조를 변환한다(단계(309)). 변환된 자료에 대하여, 통계 분석 단계(310)에서는, 사용자 관련 뉴스의 주제어 항목들에 대한 신문사별, 시기별 추이등을 밝혀내기 위한 교차 분석과, 사용자 관심 뉴스의 주제어 항목들간의 연관성을 밝혀내기 위한 군집 분석과, 이와 같이 군집화된 자료들간의 공발생(동시 발생) 확률을 기초로 사용자 관심 뉴스의 의미망 구조를 생성하는 링크 분석등의 각종 통계 분석을 수행한다. 이들 전 과정은 전술한 도 1의 뉴스 분석 프로그램(109)에 의해 이루어진다. 계속하여, 분석된 결과는, 단계(311)에서, 시각화 프로그램에 의해 그래프등으로 변환되고, 최종적으로 단계(306)에서 사용자 웹 화면을 통해 디스플레이된다.Finally, in step 302, when the news clipping server 100 determines the service type of the logged-in user by searching the user profile 104, and determines that the service type is 'news analysis service', In step 308, the data structure is converted into a form for data analysis of user-related news extracted and accumulated for a predetermined period (e.g., biweekly or monthly) (step 309). For the converted data, in the statistical analysis step 310, cross-analysis for identifying newspapers, time periods, and the like for the key word items of the user-related news, and finding the correlation between the key word items of the user interest news. Various statistical analysis such as cluster analysis and link analysis for generating a semantic network structure of user interest news based on the co-occurrence (simultaneous occurrence) probability between the clustered data. These whole processes are performed by the news analysis program 109 of FIG. 1 described above. Subsequently, the analyzed result is converted into a graph or the like by the visualization program in step 311 and finally displayed in the user web screen in step 306.

도 6 내지 8은 이와 같이 분석된 결과 데이타를 시각화하여 표시한 화면의 일례이다. 도 6은 전술한 뉴스 분석중 가장 단순한 형태인 교차 분석의 결과를 도시한 예로서, 도시된 바와 같이, 사용자 웹 화면은 크게 한 쪽(도면상의 좌측)에마련된 분석 항목 표시 영역(601)과 화면 중앙의 결과 디스플레이 영역(602)으로 구성된다. 분석 항목 표시 영역(601)에는, 사용자 관련 뉴스중 주제어들에 대한 항목, 이들을 교차 분석하기 위한 준거 항목들(예를 들어, 시기별, 신문사별,...) 및 디스플레이하고자 하는 그래프의 유형을 선택하도록 되어 있고, 중앙의 결과 디스플레이 영역(602)에는 선택 영역(601)에서 선택한 항목들과 그래프의 유형에 따라 교차 분석 결과가 디스플레이되게 된다. 도 7은 군집 분석 결과를 디스플레이한 화면의 일례로서, 도시된 바와 같이, 사용자 웹 화면은 크게 한 쪽(도면상의 좌측)에 마련된 분석 항목 표시 영역(701)과 화면 중앙의 결과 디스플레이 영역(702)으로 구성된다. 분석 항목 표시 영역(701)에는, 분석 자료의 뉴스 시기와 사용자 관련 뉴스중 분석에 사용된 주제어들을 나열하여 표시하고 있고, 분석 결과 디스플레이 영역(702)에는 군집 분석 결과가 디스플레이된다. 이 예에서는 군집 분석 결과 각각 긍적적 주제어와 부정적 주제어가 어떤 구조로 군집화되는 지를 보여주고 있다. 한편, 도 8은 링크 분석 결과인 사용자 관심 주제어들간의 의미망 구조를 도시하고 있다. 도 8은, 도 6 또는 7과 마찬가지로, 사용자 웹 화면을 크게 좌측의 분석 항목 표시 영역(801)과 화면 중앙의 결과 디스플레이 영역(802)으로 구분된다. 분석 항목 표시 영역(801)에는 분석 자료의 뉴스 시기와 분석에 사용된 핵심 주제어 및 관련 주제어들이 나열되어 있고, 분석 결과 디스플레이 영역(802)에는 의미망 구조를 보여주기 위한 링크 분석의 분석 결과를 디스플레이하고 있다. 디스플레이되는 내용은 각각의 주제어들을 의미 마디로, 주제어들 사이의 연결 관계를 의미 통로로, 그리고 주제어들 사이의 연결 강도를 0 ~ 1 사이의 수치로 표시하고 있다.6 to 8 are examples of screens that visualize and display the result data analyzed as described above. 6 shows an example of the result of the cross analysis, which is the simplest form of the above-described news analysis. As shown in the drawing, the user web screen includes an analysis item display area 601 and a screen arranged on one side (left side of the drawing). It consists of a central result display area 602. In the analysis item display area 601, items related to key words among user-related news, reference items for cross-analyzing them (e.g., time periods, newspapers, ...) and types of graphs to be displayed are displayed. In the center result display area 602, the cross analysis result is displayed according to the types of the items selected in the selection area 601 and the graph. FIG. 7 illustrates an example of a screen displaying a cluster analysis result. As illustrated, the user web screen includes an analysis item display area 701 provided on one side (left side of the drawing) and a result display area 702 in the center of the screen. It consists of. The analysis item display area 701 lists and displays the news period of the analysis data and the key words used for analysis among user-related news, and the cluster analysis result is displayed in the analysis result display area 702. In this example, the cluster analysis shows the structure of the positive and negative subjects, respectively. Meanwhile, FIG. 8 illustrates a semantic network structure among user interest subjects as a result of link analysis. 8, the user web screen is largely divided into an analysis item display area 801 on the left side and a result display area 802 on the center of the screen. The analysis item display area 801 lists the timing of news of the analysis data and key keywords and related keywords used in the analysis. The analysis result display area 802 displays the analysis results of the link analysis to show the semantic network structure. Doing. The displayed contents indicate each key word as a meaning node, a linkage relationship between the key words as a semantic passage, and a link strength between the key words as 0 to 1 values.

이상과 같이 본 발명은 뉴스 분석 서비스를 통해 사용자에게 관심 뉴스에 대한 심층적인 의미 분석의 결과를 제공하여, 사용자가 뉴스의 보도 경향이나 내용에 대해 보다 많은 통찰을 얻을 수 있게 도와 줌으로써, 사용자의 효율적인 뉴스 읽기를 가능하게 해준다.As described above, the present invention provides a result of in-depth semantic analysis of news of interest to the user through a news analysis service, thereby helping the user to obtain more insight into the news tendency and contents of the news, Enable reading of news.

이상 본 발명에 따른 뉴스 서비스 방법을 양호한 실시예를 들어 설명하였으나, 이들 실시예들에 대해서는 다양한 형태의 수정 또는 변형이 행해질 수 있으므로, 본 발명의 범위는 이들 실시예에만 국한되지 않는다. 예를 들어, 이상의 설명에서는 추출된 뉴스 정보를 사용자에게 전달하는 방법으로서, 뉴스 내용을 사용자의 웹 화면을 통해 전달하는 것에 대해서만 설명하였으나, 추출된 뉴스 정보는 이미 공지된 푸쉬(push) 기술을 통해서 휴대 전화, PDA 단말기, 호출기 등으로도 전달(casting)될 수 있으므로, 본 발명에서의 뉴스 전달 방법은 반드시 웹 화면을 통한 뉴스 캐스팅에 한정되는 것은 아니고, 이상의 모든 방법까지도 포함한다.Although the news service method according to the present invention has been described with reference to the preferred embodiments, various modifications or variations can be made to these embodiments, and the scope of the present invention is not limited to these embodiments. For example, in the above description, as a method of delivering the extracted news information to the user, only the news content is transmitted through the user's web screen, but the extracted news information is already known through a push technology. Since the present invention can be cast by a mobile phone, a PDA terminal, a pager, or the like, the news delivery method in the present invention is not necessarily limited to newscasting through a web screen, and includes all the above methods.

따라서, 본 발명의 범주는 이하의 특허청구범위에 기재된 사항에 의해서 정해지는 것이고, 이상의 실시예에 대한 설명은 단지 이에 대한 예시로써만 받아들여져야 한다.Accordingly, the scope of the invention is defined by the matters set forth in the claims below, and the description of the above embodiments should be taken only as an example thereof.

이상 설명한 바와 같이, 본 발명의 '뉴스 기본 서비스(news basic service)'에 따르면, 국내 또는 국외의 주요 뉴스 사이트에서 제공되는 모든 뉴스 정보들이각각의 섹션별로 한 화면상에서 디스플레이 되므로, 동일한 이슈에 대한 각 신문사들의 보도 경향을 비교하여 읽거나 전세계 뉴스의 주요 변화와 흐름을 한 눈에 파악할 수 있게 된다.As described above, according to the 'news basic service' of the present invention, since all the news information provided by major news sites in Korea or abroad are displayed on one screen for each section, You can compare the reading trends of newspapers and read at a glance the major changes and trends in news around the world.

또한, 본 발명은 국내외의 뉴스 사이트에 게재된 뉴스 정보를 사용자의 요구나 환경에 따라 사용자에게 전달하는 뉴스 추적 서비스를 제공함으로써, 사용자가 복잡한 질의어를 사용하여 정보를 얻어내야만 하는 불편함과 사용자의 검색 시간을 줄일 수 있을 뿐만 아니라, 필요한 뉴스 정보에 대한 검색의 정확성 제고 및 웹 개인화를 통한 완벽한 의미의 일대일 맞춤 뉴스 서비스를 제공할 수 있게 된다.In addition, the present invention provides a news tracking service that delivers the news information posted on the domestic and international news site to the user according to the user's needs or environment, the inconvenience that the user has to obtain information using a complex query language In addition to shortening the search time, it is possible to provide a complete one-to-one customized news service through improved accuracy of searching for necessary news information and web personalization.

나아가, 본 발명은 뉴스 분석 서비스를 통해 사용자에게 관심 뉴스에 대한 심층적인 의미 분석의 결과를 제공하여, 사용자가 뉴스의 보도 경향이나 내용에 대해 보다 많은 통찰을 얻을 수 있게 도와 줌으로써, 사용자의 효율적인 뉴스 읽기를 가능하게 해준다.Furthermore, the present invention provides the results of in-depth semantic analysis of the news of interest to the user through the news analysis service, thereby helping the user to gain more insight into the news tendency or contents of the news, thereby providing effective news for the user. Enable reading

Claims (11)

Translated fromKorean
복수개의 뉴스 사이트로부터 제공되는 뉴스 정보를 실시간으로 수집하여 이를 사용자의 웹 화면을 통해 제공하는 뉴스 서비스 방법에 있어서,In the news service method for collecting news information provided from a plurality of news sites in real time and providing them through a user's web screen,상기 복수개의 뉴스 사이트에 대한 URL 주소를 저장하는 단계;Storing URL addresses for the plurality of news sites;상기 저장된 URL 주소를 판독하고, 이를 기초로 해당 URL의 상기 복수개의 뉴스 사이트들을 소정 시간마다 검색하여 갱신된 뉴스 정보를 선별, 수집하는 단계;Reading and storing the updated news information by searching the plurality of news sites of the corresponding URL every predetermined time based on the stored URL address;수집된 뉴스 정보들을 뉴스 사이트 및 뉴스 섹션별로 분류하여 범주화된 뉴스 데이터베이스에 저장하는 단계;Classifying the collected news information by news site and news section and storing the classified news information in a categorized news database;상기 사용자의 로그인에 응답하여, 상기 분류된 상태로 저장된 뉴스 정보들에 대하여, 뉴스 사이트 및 뉴스 섹션별로 차례대로 검색 및 추출 작업을 행하는 단계; 및In response to the user's login, searching and extracting the news information stored in the classified state in order by news site and news section; And상기 사용자의 웹 화면을 복수개의 뉴스 사이트 표시 영역과 뉴스 섹션으로 구분된 형태로 구성하고, 상기 추출된 뉴스 정보들을 상기 사용자 웹 화면상에 대응되는 각각의 영역으로 매칭시켜 표시함으로써, 하나의 뉴스 섹션에 포함되는 복수개의 뉴스 사이트로부터의 뉴스 정보들이 하나의 웹 화면상에서 동시에 표시될 수 있도록 하는 단계One news section by configuring the user's web screen in a form divided into a plurality of news site display areas and a news section, and matching the extracted news information to respective areas corresponding to the user web screen. Allowing news information from a plurality of news sites included in the to be simultaneously displayed on a single web screen.를 포함하는 뉴스 서비스 방법.News service method comprising a.제1항에 있어서,The method of claim 1,상기 URL 주소를 저장하는 단계는 국내 또는 해외의 180개 뉴스 사이트에 대한 URL 주소를 저장하는 단계를 포함하는 뉴스 서비스 방법.The storing of the URL address may include storing URL addresses of 180 news sites in Korea or abroad.제1항에 있어서,The method of claim 1,상기 뉴스 정보를 소정 시간마다 수집하는 단계는 상기 뉴스 사이트들로부터 뉴스 정보들을 적어도 5분 간격으로 수집하는 단계를 포함하는 뉴스 서비스 방법.Collecting the news information every predetermined time comprises collecting news information from the news sites at least five minutes apart.복수개의 뉴스 사이트로부터 제공되는 뉴스 정보 중 사용자의 요구에 적합한 뉴스 정보만을 추적하여 전달하는 뉴스 서비스 방법에 있어서,In the news service method for tracking and delivering only the news information that meets the needs of the user from the news information provided from a plurality of news sites,상기 사용자의 초기 사용 행태에 대한 로그 파일과 사용자의 개별 뉴스에 대한 적합도 평가를 종합 분석하여, 상기 사용자의 성향 및 요구 사항에 대한 정보를 추출하고 이를 사용자 프로파일에 저장하는 단계;Comprehensively analyzing a log file of the user's initial usage behavior and a fitness evaluation for the individual news of the user, extracting information on the user's disposition and requirements, and storing the information in the user profile;상기 복수개의 뉴스 사이트에 대한 URL 주소를 저장하는 단계;Storing URL addresses for the plurality of news sites;상기 저장된 URL 주소를 판독하고, 이를 기초로 상기 복수개의 뉴스 사이트들로부터 뉴스 정보들을 소정 시간마다 수집하는 단계;Reading the stored URL address and collecting news information every predetermined time from the plurality of news sites based on the stored URL address;수집된 뉴스 정보들을 뉴스 사이트 및 뉴스 섹션별로 분류하여 범주화된 뉴스 데이터베이스에 저장하는 단계;Classifying the collected news information by news site and news section and storing the classified news information in a categorized news database;상기 분류된 뉴스 정보들에 대하여 형태소 분석을 행하여 인덱스 파일을 작성하는 단계;Generating an index file by performing morphological analysis on the classified news information;상기 사용자의 로그인에 응답하여, 상기 사용자 프로파일을 검색하고 상기 사용자의 요구 사항에 적합한 검색 질의어를 생성하는 단계;Responsive to login of the user, retrieving the user profile and generating a search query suitable for the user's requirements;상기 뉴스 데이터베이스에 저장된 뉴스 정보 중에서, 상기 검색 질의어와 일치하는 상기 인덱스 파일에 의해 참조되는 뉴스 데이터베이스 영역의 뉴스 정보만을 검색, 추출하는 단계; 및Searching and extracting only news information of a news database area referred to by the index file matching the search query, from news information stored in the news database; And상기 추출된 뉴스 정보를 사용자에게 전달하는 단계Delivering the extracted news information to a user를 포함하는 뉴스 서비스 방법.News service method comprising a.제4항에 있어서,The method of claim 4, wherein상기 URL 주소를 저장하는 단계는 국내 또는 해외의 180개 뉴스 사이트에 대한 URL 주소를 저장하는 단계를 포함하는 뉴스 서비스 방법.The storing of the URL address may include storing URL addresses of 180 news sites in Korea or abroad.제4항에 있어서,The method of claim 4, wherein상기 뉴스 정보를 소정 시간마다 수집하는 단계는 상기 뉴스 사이트들로부터 뉴스 정보들을 적어도 5분 간격으로 수집하는 단계를 포함하는 뉴스 서비스 방법.Collecting the news information every predetermined time comprises collecting news information from the news sites at least five minutes apart.제4항에 있어서,The method of claim 4, wherein상기 사용자의 로그인 단계 및 사용자로의 뉴스 전달 단계는, 사용자 웹 화면, 휴대 전화, PDA 단말기 또는 호출기 중 하나를 통해 이루어지는 뉴스 서비스 방법.The log-in step of the user and the news delivery step to the user is via a user web screen, a mobile phone, a PDA terminal or a pager.제4항에 있어서, 상기 뉴스 정보에 대하여 형태소 분석을 행하는 단계는,The method of claim 4, wherein the morphological analysis of the news information comprises:상기 뉴스 사이트 및 섹션별로 분류된 각 뉴스 정보들의 HTML 페이지로부터 제목, 본문 및 URL을 추출하는 단계;Extracting a title, a text, and a URL from an HTML page of news information classified by the news site and section;상기 추출된 제목, 본문 및 URL에 대하여 형태소 분석을 수행하는 단계; 및Performing a morphological analysis on the extracted title, text, and URL; And상기 형태소 분석의 결과에 따라 상기 제목, 본문 및 URL에 대한 인덱싱을 행하는 단계Indexing the title, body, and URL according to the result of the morphological analysis를 포함하는 뉴스 서비스 방법.News service method comprising a.제4항에 있어서,The method of claim 4, wherein상기 사용자의 요구 사항에 대한 정보는 상기 사용자의 이름, 상기 사용자가 속한 조직의 이름, 또는 상기 사용자가 속한 조직과 경쟁 관계에 있는 조직 또는 사람의 이름인 뉴스 서비스 방법.The information about the requirements of the user is the name of the user, the name of the organization to which the user belongs, or the name of an organization or person competing with the organization to which the user belongs.제4항에 있어서,The method of claim 4, wherein상기 추출된 뉴스 정보를 소정 기간 단위로 저장한 뒤, 상기 저장된 뉴스 정보들을 자료 분석을 위한 데이터로 변환하여 상기 변환된 데이타들을 대상으로 통계 분석을 행하는 단계를 더 포함하는 뉴스 서비스 방법.Storing the extracted news information in a predetermined period unit, and converting the stored news information into data for data analysis and performing statistical analysis on the converted data.제10항에 있어서,The method of claim 10,상기 추출된 뉴스 정보는 격주간 또는 월간 단위로 저장되며, 상기 통계 분석은 교차 분석, 군집 분석 및 링크 분석중 적어도 하나를 포함하는 것을 특징으로 하는 뉴스 서비스 방법.The extracted news information is stored every other week or monthly, and the statistical analysis includes at least one of cross analysis, cluster analysis, and link analysis.
KR1020000046899A2000-08-142000-08-14News tracker and analysis service based on web personalizationCeasedKR20020014026A (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
KR1020000046899AKR20020014026A (en)2000-08-142000-08-14News tracker and analysis service based on web personalization

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
KR1020000046899AKR20020014026A (en)2000-08-142000-08-14News tracker and analysis service based on web personalization

Publications (1)

Publication NumberPublication Date
KR20020014026Atrue KR20020014026A (en)2002-02-25

Family

ID=19683059

Family Applications (1)

Application NumberTitlePriority DateFiling Date
KR1020000046899ACeasedKR20020014026A (en)2000-08-142000-08-14News tracker and analysis service based on web personalization

Country Status (1)

CountryLink
KR (1)KR20020014026A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
KR20030094966A (en)*2002-06-112003-12-18주식회사 코스모정보통신Rule based document auto taxonomy system and method
KR100478585B1 (en)*2002-09-022005-03-28삼성에스디에스 주식회사System and method for automatic notifying of a bulletin for an internet newspaper
WO2007004844A1 (en)*2005-07-062007-01-11Yoon-Hyoung EoA news supplying system with a global timepiece
KR100726886B1 (en)*2005-08-192007-06-12(주)수도프리미엄엔지니어링 Internet web document retrieval system and its method
KR100771506B1 (en)*2006-02-132007-10-30주식회사 디알에프앤 Securities information provision system using news
WO2009142935A3 (en)*2008-05-232010-02-25Yahoo! Inc.Ordering relevant content by time for determining top picks
US7860872B2 (en)*2007-01-292010-12-28Nikip Technology Ltd.Automated media analysis and document management system
KR101425816B1 (en)*2013-10-292014-08-05네이버 주식회사Real-time search method and real-time search system
KR20200142258A (en)*2019-06-122020-12-22카페24 주식회사Method, apparatus, and system visualizing correlation level between setup fields
CN113763959A (en)*2021-10-192021-12-07康佳集团股份有限公司Voice control method, device, terminal and storage medium based on information reorganization

Cited By (11)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
KR20030094966A (en)*2002-06-112003-12-18주식회사 코스모정보통신Rule based document auto taxonomy system and method
KR100478585B1 (en)*2002-09-022005-03-28삼성에스디에스 주식회사System and method for automatic notifying of a bulletin for an internet newspaper
WO2007004844A1 (en)*2005-07-062007-01-11Yoon-Hyoung EoA news supplying system with a global timepiece
KR100726886B1 (en)*2005-08-192007-06-12(주)수도프리미엄엔지니어링 Internet web document retrieval system and its method
KR100771506B1 (en)*2006-02-132007-10-30주식회사 디알에프앤 Securities information provision system using news
US7860872B2 (en)*2007-01-292010-12-28Nikip Technology Ltd.Automated media analysis and document management system
WO2009142935A3 (en)*2008-05-232010-02-25Yahoo! Inc.Ordering relevant content by time for determining top picks
KR101425816B1 (en)*2013-10-292014-08-05네이버 주식회사Real-time search method and real-time search system
KR20200142258A (en)*2019-06-122020-12-22카페24 주식회사Method, apparatus, and system visualizing correlation level between setup fields
CN113763959A (en)*2021-10-192021-12-07康佳集团股份有限公司Voice control method, device, terminal and storage medium based on information reorganization
CN113763959B (en)*2021-10-192024-01-26康佳集团股份有限公司Voice control method, device, terminal and storage medium based on information recombination

Similar Documents

PublicationPublication DateTitle
US7640232B2 (en)Search enhancement system with information from a selected source
KR101031449B1 (en) Search Query Processing System and Method Using Trend Analysis
US7165119B2 (en)Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter
US9251279B2 (en)Methods and systems for using community defined facets or facet values in computer networks
US8862580B1 (en)Category-based search
US7185089B2 (en)Method and system for displaying integrated log information
JP3717808B2 (en) Information retrieval system
JP4535765B2 (en) Content navigation program, content navigation method, and content navigation apparatus
US20080104542A1 (en)Apparatus and Method for Conducting Searches with a Search Engine for Unstructured Data to Retrieve Records Enriched with Structured Data and Generate Reports Based Thereon
JP2009503751A (en) Relevance determination method, information collection method, object organization method, and search system
KR100974064B1 (en) Customized information provision system and method
WO2007035859A2 (en)System and method for selecting advertising
CN101382954A (en)Method and system for providing web site collection name
KR100434902B1 (en)Knowledge base custom made information offer system and service method thereof
US20050038866A1 (en)Information search support apparatus, computer program, medium containing the program
KR100671077B1 (en) Server, method and system for providing information retrieval service using page bundle
KR20000054312A (en)Establishing provide Method for ordered web information
KR20020014026A (en)News tracker and analysis service based on web personalization
JP2007018285A (en) Information providing system, information providing method, information providing apparatus, and information providing program
KR20050070955A (en)Method of scientific information analysis and media that can record computer program thereof
US20030023624A1 (en)Web browser interest terms
KR20030051577A (en)Display method for research result in internet site
WO2008032037A1 (en)Method and system for filtering and searching data using word frequencies
KR101440385B1 (en)Device for managing information using indicator
August et al.Mobile web searching

Legal Events

DateCodeTitleDescription
A201Request for examination
PA0109Patent application

Patent event code:PA01091R01D

Comment text:Patent Application

Patent event date:20000814

PA0201Request for examination
N231Notification of change of applicant
PN2301Change of applicant

Patent event date:20010814

Comment text:Notification of Change of Applicant

Patent event code:PN23011R01D

PG1501Laying open of application
E902Notification of reason for refusal
PE0902Notice of grounds for rejection

Comment text:Notification of reason for refusal

Patent event date:20020628

Patent event code:PE09021S01D

E601Decision to refuse application
PE0601Decision on rejection of patent

Patent event date:20020930

Comment text:Decision to Refuse Application

Patent event code:PE06012S01D

Patent event date:20020628

Comment text:Notification of reason for refusal

Patent event code:PE06011S01I


[8]ページ先頭

©2009-2025 Movatter.jp