Movatterモバイル変換


[0]ホーム

URL:


WO2022003217A1 - Ontology-based method and system for restricted access to data - Google Patents

Ontology-based method and system for restricted access to data
Download PDF

Info

Publication number
WO2022003217A1
WO2022003217A1PCT/ES2020/070431ES2020070431WWO2022003217A1WO 2022003217 A1WO2022003217 A1WO 2022003217A1ES 2020070431 WES2020070431 WES 2020070431WWO 2022003217 A1WO2022003217 A1WO 2022003217A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
concepts
input data
access
exploitation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/ES2020/070431
Other languages
Spanish (es)
French (fr)
Inventor
Mendez OSCAR
Martin Roman
Tulio MARCO
Vassal'lo ROQUE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stratio Big Data Inc Sucursal En Espana
Original Assignee
Stratio Big Data Inc Sucursal En Espana
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stratio Big Data Inc Sucursal En EspanafiledCriticalStratio Big Data Inc Sucursal En Espana
Priority to PCT/ES2020/070431priorityCriticalpatent/WO2022003217A1/en
Publication of WO2022003217A1publicationCriticalpatent/WO2022003217A1/en
Anticipated expirationlegal-statusCritical
Ceasedlegal-statusCriticalCurrent

Links

Classifications

Definitions

Landscapes

Abstract

Proposed is a computer-implemented method and an electronic system for managing and gaining access to data in an optimised way. The proposed solution allows a data layer, independent of the physical data model, to be provided by means of a semantic and business definition based on ontologies. Once the data layer has been created, all data management and access is based on said layer, allowing data access based on a business definition, thereby separating all the processes/systems that use the data from the physical data models and making them portable in different situations.

Description

Translated fromSpanish

DESCRIPCIÓN DESCRIPTION

MÉTODO Y SISTEMA PARA EL ACCESO RESTRINGIDO A DATOS MEDIANTE ONTOLOGÍASMETHOD AND SYSTEM FOR RESTRICTED ACCESS TO DATA THROUGH ONTOLOGIES

Campo técnico de la invenciónTechnical field of the invention

La presente invención propone una capa de datos que incorpora mecanismos de mejora y, más específicamente, la invención descrita en la presente memoria trata de un método implementado por ordenador y un sistema electrónico para el acceso, gestión y la explo tación de información (datos) de una manera optimizada.The present invention proposes a data layer that incorporates improvement mechanisms and, more specifically, the invention described herein deals with a method implemented by a computer and an electronic system for the access, management and exploitation of information (data) in an optimized way.

Antecedentes de la invenciónBackground of the invention

Los sistemas de información existentes para el análisis o explotación de datos dependen mucho de su aplicación particular; es decir, deben de adaptarse o crear modelos de da tos físicos/técnicos adaptados al repositorio o base de datos así como al caso de uso para el que se empleen. Por lo tanto, no logran el nivel de abstracción necesario para ofrecer portabilidad, reutilización ni gestión de datos en base a su relevancia, para casos distintos. Esto es debido a que dichos sistemas, entre otras cosas, no son capaces de:The existing information systems for the analysis or exploitation of data depend a lot on their particular application; that is, they must adapt or create physical / technical data models adapted to the repository or database as well as the use case for which they are used. Therefore, they do not achieve the level of abstraction necessary to offer portability, reuse or management of data based on its relevance, for different cases. This is because these systems, among other things, are not capable of:

• Exponer los datos de forma estándar y directa desde una definición de su relevancia en los resultados (por ejemplo, de un determinado negocio) ontológica y totalmente compa tible con las herramientas empresariales de explotación de datos actuales.• Exposing data in a standard and direct way from a definition of its relevance in the results (for example, of a certain business) ontologically and fully compatible with current business data exploitation tools.

• Asignar significado de negocio, de forma automática, al dato alojado en sistemas de información en base a una definición ontológica.• Assign business meaning, automatically, to data stored in information systems based on an ontological definition.

• Gestionar la seguridad y del acceso al dato técnico en base a su definición y significado de negocio expresado mediante ontologías.• Manage security and access to technical data based on its definition and business meaning expressed through ontologies.

• Manejar el dato técnico en base a su definición y significado de negocio expresado me diante ontologías.• Manage technical data based on its definition and business meaning expressed through ontologies.

• Realizar consistencia automática del sistema de información en base a las entidades de negocio expresado mediante ontologías. Por lo tanto, hay una necesidad de un sistema de gestión y acceso a datos que permita, de manera eficiente y con ahorro de recursos, proporcionar las capacidades citadas ante riormente para ofrecer un acceso a los datos totalmente portable, reutilizable y que ob tenga el máximo partido posible a dichos datos, no presentando las limitaciones y vulne rabilidades de los sistemas existentes en la actualidad.• Carry out automatic consistency of the information system based on the business entities expressed through ontologies. Therefore, there is a need for a data access and management system that allows, in an efficient and resource-saving manner, to provide the aforementioned capabilities to offer fully portable, reusable and user-friendly data access. maximum possible use of said data, not presenting the limitations and vulnerabilities of the systems that currently exist.

Resumen de la invenciónSummary of the invention

La invención propuesta resuelve los problemas que presentan las soluciones del estado de la técnica, proponiendo un método implementado por ordenador y un sistema electró nico que mejora de la gestión y el acceso a información (datos técnicos), para su explota ción, de una manera optimizada, flexible y universal (portable a un amplio espectro de aplicaciones/software que explotan dichos datos).The proposed invention solves the problems presented by the solutions of the state of the art, proposing a method implemented by computer and an electronic system that improves the management and access to information (technical data), for its exploitation, in a way optimized, flexible and universal (portable to a wide spectrum of applications / software that exploit such data).

La invención propuesta permite ofrecer una capa de datos, independiente del modelo físico, mediante una definición de negocio y semántica, preferiblemente en base a onto- logías. Una vez creada esta capa de datos (llamada BDL, del inglés Business Data La- yer), todo acceso al dato se realiza en base a dicha capa, permitiendo entre otras cosas el acceso al dato en base a una definición de negocio desacoplada del modelo técnico del dato y proporcionando mecanismos estándares para ello (como SQL o API RestFul o cualquier otra).The proposed invention makes it possible to offer a data layer, independent of the physical model, through a business and semantic definition, preferably based on ontologies. Once this data layer is created (called BDL, from the English Business Data Layer), all access to the data is made based on said layer, allowing, among other things, access to the data based on a business definition decoupled from the model. data technician and providing standard mechanisms for it (such as SQL or RestFul API or any other).

Hay que indicar que cuando en el presente texto se habla de negocio, se refiere no solo a actividades financieras/económicas propiamente dichas sino también a cualquier aplica ción/actividad final técnica que explota los datos con cualquier tipo de propósito final.It should be noted that when business is discussed in this text, it refers not only to financial / economic activities as such but also to any application / final technical activity that exploits the data for any type of final purpose.

La presente invención presenta, entre otras, las siguientes ventajas técnicas:The present invention has, among others, the following technical advantages:

- Permite desacoplar todos los procesos/sistemas que explotan el dato, de los modelos físicos de datos, y hacerlos portables en diferentes escenarios. La combinación de proce sos junto con la definición semántica (a través de ontologías) hace reutilizable y portable el modelo de datos y los procesos que se ejecutan sobre él, incluyendo: procesos de tra tamiento de datos, modelos de aprendizaje automático (en inglés machine learning), mi- croservicios, herramientas de Bl (del inglés, Business Intelligence, Inteligencia de nego cio) y reporting, etc. Esta capa de abstracción proporciona una reutilización completa que permite desarrollar los componentes de software una vez y reutilizar tantas veces como sea necesario sin necesidad de cambiar el software o los repositorios de datos.- It allows decoupling all the processes / systems that exploit the data, from the physical data models, and make them portable in different scenarios. The combination of processes together with the semantic definition (through ontologies) makes the data model and the processes that run on it reusable and portable, including: data processing processes, machine learning models (in English machine learning), microservices, BI tools (English, Business Intelligence, Business Intelligence) and reporting, etc. This abstraction layer provides complete reuse that allows you to develop software components once and reuse as many times as necessary without the need to change software or data repositories.

- Tener un modelo de datos definido en base a entidades de negocio sin dependencias con sistemas o modelos de datos físicos consigue aumentar de forma significativa la pro ductividad al eliminar capas intermediarias entre el dato y los expertos que conocen dicho dato y saben cómo obtener valor de él.- Having a data model defined based on business entities without dependencies on physical data models or systems achieves a significant increase in productivity by eliminating intermediate layers between the data and the experts who know said data and know how to obtain value from he.

- La asignación de significado de negocio de forma automática aumenta de forma drásti ca la capacidad de explotación y uso del dato como activo, al dar visibilidad a mucha in formación que de otra forma se encuentra infrautilizada o enterrada (cementerios de da tos) en los sistemas de información actuales.- The automatic assignment of business meaning dramatically increases the capacity to exploit and use data as an asset, by giving visibility to a lot of information that is otherwise underused or buried (data cemeteries) in the current information systems.

- Aumenta de forma sensible la eficiencia y la eficacia en el control de la seguridad y del acceso al dato, mejorando la portabilidad de requisitos de cumplimiento (en inglés com- pliance) a través de la definición de reglas de acceso en el business data layer (capa de datos de negocio), reduciendo los costes operativos de este tipo de escenarios significa tivamente.- It significantly increases the efficiency and effectiveness in the control of security and access to data, improving the portability of compliance requirements (in English compliance) through the definition of access rules in the business data layer (business data layer), reducing the operating costs of this type of scenario significantly.

- Dota de contexto de negocio a la gestión del dato, evitando tener que mantener siste mas adicionales que den ese contexto, reduciendo los costes operativos de este tipo de escenarios significativamente.- Provides business context to data management, avoiding having to maintain additional systems that provide that context, significantly reducing operating costs in these types of scenarios.

Para ello, en un primer aspecto, la presente invención presenta un método implementado por ordenador para mejorar la gestión y el acceso a información para su explotación (por un sistema electrónico, proceso, programa o aplicación que desea explotar los datos con cualquier tipo de propósito), donde el método comprende los siguientes pasos realizados por uno o más procesadores electrónicos: a) Descubrir (obtener) un conjunto de datos de entrada y (determinar) las características técnicas (modelos técnicos, metadatos) de dichos datos de entrada (por ejemplo, datos técnicos o físicos); b) Definir un conjunto de conceptos (por ejemplo, semánticos) para la explotación de la información contenida por el conjunto de datos de entrada (donde dichos conceptos de penderán del modelo de explotación de la información deseado); c) Asignar a datos del conjunto de datos de entrada al menos uno de los conceptos defi nidos, en base al valor y/o las características técnicas de los datos y almacenar dicha asignación en una o más bases de datos; d) Permitir el acceso a los conceptos asignados correspondientes al conjunto de datos de entrada, por parte de uno o más sistemas electrónicos y/o procesos (por ejemplo, me diante programas de ordenador) que explotan o quieren explotar los datos de entrada; donde para dicho acceso se aplican una o más reglas de control de acceso previamente definidas.For this, in a first aspect, the present invention presents a method implemented by computer to improve the management and access to information for its exploitation (by an electronic system, process, program or application that wishes to exploit the data for any type of purpose. ), where the method comprises the following steps performed by one or more electronic processors: a) Discover (obtain) a set of input data and (determine) the technical characteristics (technical models, metadata) of said input data (for example , technical or physical data); b) Define a set of concepts (for example, semantics) for the exploitation of the information contained by the input data set (where said concepts will depend on the desired information exploitation model); c) Assigning to data from the input data set at least one of the defined concepts, based on the value and / or technical characteristics of the data and storing said assignment in one or more databases; d) Allow access to the assigned concepts corresponding to the input data set, by one or more electronic systems and / or processes (for example, through computer programs) that exploit or want to exploit the input data; where one or more previously defined access control rules are applied for said access.

La definición de conceptos se puede realizar mediante el uso de ontologías (por ejemplo, usando técnicas FIBO o cualquiera otras).The definition of concepts can be done through the use of ontologies (for example, using FIBO techniques or any other).

En una realización, el paso c) comprende: almacenar uno o varios escenarios a partir del conjunto de datos de entrada; definir o adquirir uno o más conceptos y almacenarlos; relacionar cada uno de los escenarios de datos con uno o más conceptos; almacenar dichas relaciones. Donde cada escenario puede comprender estructuras de datos (es tructura de tabla/archivo), datos de perfil inicial y el resultado esperado.In one embodiment, step c) comprises: storing one or more scenarios from the input data set; define or acquire one or more concepts and store them; relate each of the data scenarios to one or more concepts; store those relationships. Where each scenario can comprise data structures (table / file structure), initial profile data and the expected result.

La asignación de datos a conceptos en el paso c) se puede realizar usando patrones pa ra cada concepto, que definen las características que debe tener un dato para asignarlo a un determinado concepto. Este paso puede comprender el uso de un algoritmo de con vergencia estadística mediante refuerzo.Assigning data to concepts in step c) can be done using patterns for each concept, which define the characteristics that a data must have to assign it to a certain concept. This step may comprise the use of a statistical convergence by reinforcement algorithm.

El paso d) también puede incluir: Permitir la gestión de los conceptos asignados corres pondientes al conjunto de datos de entrada, por parte de uno o más sistemas electróni cos y/o procesos (por ejemplo, programas de ordenador) de explotación de los datos de entrada; donde dicha gestión se realiza de acuerdo a uno o más atributos de gobierno previamente definidos.Step d) may also include: Allow the management of the assigned concepts corresponding to the input data set, by one or more electronic systems and / or processes (for example, computer programs) for data exploitation input; where said management is carried out according to one or more previously defined governance attributes.

Tras la asignación de conceptos (paso c)) se puede realizar una comprobación de la con sistencia de la información almacenada (datos y/o conceptos). Por ejemplo, la consisten cia se puede gestionar en base a entidades de negocio definidas mediante ontologías. El descubrimiento del conjunto de datos de entrada se puede realizar recibiendo los da tos a través de una red de comunicación (alámbrica, inalámbrica o de cualquier tipo).After assigning concepts (step c)), a check can be made of the consistency of the stored information (data and / or concepts). For example, consistency can be managed based on business entities defined through ontologies. Discovery of the input data set can be done by receiving the data through a communication network (wired, wireless, or whatever).

En el paso a) como partes de las características técnicas se pueden descubrir los mode los técnicos que siguen los datos del conjunto de datos de entrada y/o metadatos técni cos de los datos del conjunto de datos de entrada.In step a) as parts of the technical characteristics, you can discover the technical models that follow the data of the input data set and / or technical metadata of the data of the input data set.

En el paso d), se puede permitir el acceso a los conceptos por parte de uno o más siste mas electrónicos y/o procesos de explotación de los datos de entrada, usando un lengua je estructurado de consultas, SQL.In step d), it is possible to allow access to the concepts by one or more electronic systems and / or processes of exploitation of the input data, using a structured query language, SQL.

En un segundo aspecto, se presentan sistemas que llevan a cabo los métodos anterior mente descritos. En concreto se presenta un sistema para mejorar la gestión y el acceso a información para su explotación, donde el sistema comprende uno o más procesadores electrónicos configurados para:In a second aspect, systems are presented that carry out the methods described above. Specifically, a system is presented to improve the management and access to information for its exploitation, where the system comprises one or more electronic processors configured to:

- Descubrir un conjunto de datos de entrada y (determinar) las características técnicas (modelos técnicos) de dichos datos;- Discover a set of input data and (determine) the technical characteristics (technical models) of said data;

- Definir un conjunto de conceptos (por ejemplo, semánticos) para la explotación de la información contenida por el conjunto de datos de entrada (donde dichos conceptos de penderán del modelo de explotación de la información deseado);- Define a set of concepts (for example, semantics) for the exploitation of the information contained by the input data set (where said concepts will depend on the desired information exploitation model);

- Asignar a datos del conjunto de datos de entrada al menos uno de los conceptos defini dos, en base al valor y/o las características técnicas de los datos y almacenar dicha asig nación en una o más bases de datos;- Assigning to data from the input data set at least one of the defined concepts, based on the value and / or technical characteristics of the data and storing said assignment in one or more databases;

- Permitir el acceso a los conceptos asignados correspondientes al conjunto de datos de entrada, por parte de uno o más (otros) sistemas electrónicos y/o procesos (por ejemplo, mediante programas de ordenador) de explotación de los datos de entrada; donde para dicho acceso se aplican una o más reglas de control de acceso previamente definidas.- Allow access to the assigned concepts corresponding to the input data set, by one or more (other) electronic systems and / or processes (for example, through computer programs) for the exploitation of the input data; where one or more previously defined access control rules are applied for said access.

Finalmente, en un tercer aspecto de la invención se presenta un programa de ordenador que comprende instrucciones ejecutables por ordenador para implementar el método descrito, al ejecutarse en un ordenador, un procesador digital de la señal, un circuito integrado específico de la aplicación, un microprocesador, un microcontrolador o cualquier otra forma de hardware programable. Dichas instrucciones pueden estar alma- almacenadas en un medio de almacenamiento de datos digitales.Finally, in a third aspect of the invention, a computer program is presented that comprises computer-executable instructions to implement the described method, when executed on a computer, a digital signal processor, an application-specific integrated circuit, a microprocessor , a microcontroller or any other form of programmable hardware. Said instructions may be stored on a digital data storage medium.

Aspectos, realizaciones y detalles adicionales, específicos y preferidos, de la invención se enuncian en las reivindicaciones adjuntas, independientes y dependientes. Para un entendimiento más completo de la invención, sus objetos y ventajas, puede hacerse referencia a la siguiente memoria descriptiva y a los dibujos adjuntos.Additional, specific and preferred aspects, embodiments and details of the invention are set forth in the accompanying independent and dependent claims. For a more complete understanding of the invention, its objects and advantages, reference may be made to the following specification and the accompanying drawings.

Descripción de los dibujosDescription of the drawings

Para completar la descripción que se está haciendo, y con el objeto de asistir para una mejor comprensión de las características de la invención, según un ejemplo preferido de realización práctica de la misma, que acompaña dicha descripción como una parte integral de la misma, hay un conjunto de dibujos en los cuales, a modo de ilustración y no de manera restrictiva, ha sido representado lo siguiente:To complete the description that is being made, and in order to assist in a better understanding of the characteristics of the invention, according to a preferred example of a practical embodiment thereof, which accompanies said description as an integral part thereof, there are a set of drawings in which, by way of illustration and not in a restrictive way, the following has been represented:

La Figura 1 muestra un diagrama esquemático de la capa de datos según una realización de la presente invención.Figure 1 shows a schematic diagram of the data layer according to an embodiment of the present invention.

La Figura 2 muestra de manera esquemática las fases, herramientas y algoritmos de la solución propuesta, de acuerdo a una realización de la presente invención.Figure 2 schematically shows the phases, tools and algorithms of the proposed solution, according to an embodiment of the present invention.

La Figura 3 muestra de manera esquemática un posible ejemplo de transformación de modelos ontológicos, de acuerdo a una realización de la presente invención.Figure 3 schematically shows a possible example of transformation of ontological models, according to an embodiment of the present invention.

Descripción detallada de la invenciónDetailed description of the invention

La presente invención propone un mecanismo para la gestión y el acceso a información (por ejemplo, datos técnicos o físicos) para su explotación, de una manera optimizada. La invención propuesta permite ofrecer una capa de (acceso de) datos, independiente del modelo físico, mediante una definición de negocio y semántica en base a ontologías.The present invention proposes a mechanism for the management and access to information (for example, technical or physical data) for its exploitation, in an optimized way. The proposed invention makes it possible to offer a data (access) layer, independent of the physical model, by means of a business definition and semantics based on ontologies.

Hoy en día la mayoría de aplicaciones software o sistemas electrónicos, necesitan una conceptualización/abstracción de los datos de entrada para poder emplearlos convenientemente. La solución propuesta en este texto, provee un modo práctico y efi- eficiente de crear y hacer crecer la capa conceptual de datos; es decir, provee un modo práctico y eficiente de hacer la conversión de datos a conceptos. El desarrollo del software necesario para estas aplicaciones o sistemas electrónicos, se realiza sobre esta capa de conceptualización de manera sencilla y, además, desarrollos futuros del software serán más simples y rápidos de hacer. Los datos de entrada existentes pueden ser auto- descubiertos y expuestos como conceptos. Además la solución propuesta hace los datos más fáciles de encontrar (mediante indexación) lo que permitirá, por ejemplo, recobrar datos perdidos u olvidados con poca o ninguna intervención humana.Today most software applications or electronic systems need a conceptualization / abstraction of the input data to be able to use them. conveniently. The solution proposed in this text provides a practical and efficient way to create and grow the conceptual data layer; that is, it provides a practical and efficient way of converting data to concepts. The development of the necessary software for these applications or electronic systems is carried out on this conceptualization layer in a simple way and, in addition, future developments of the software will be simpler and faster to do. Existing input data can be self-discovered and exposed as concepts. Furthermore, the proposed solution makes the data easier to find (through indexing) which will allow, for example, to recover lost or forgotten data with little or no human intervention.

Esta capa conceptual preferiblemente es semántica; aunque también puede ser virtualizada o, generalmente hablando, puede ser cualquier tipo de capa de alto nivel que agrupa sets de datos dependiendo de su naturaleza o significado, de manera que la capa incorpora un nivel de abstracción a dichos datos que hacen que la información ofrecida por la capa (conceptos) no esté vinculada ni limitada por la localización de los datos o sus propiedades físicas.This conceptual layer is preferably semantic; although it can also be virtualized or, generally speaking, it can be any type of high-level layer that groups data sets depending on their nature or meaning, so that the layer incorporates a level of abstraction to said data that makes the information offered by layer (concepts) is not linked or limited by the location of the data or its physical properties.

La figura 1 muestra un modelo de dicha capa de acuerdo con una realización de la invención. En ella se ve que existe una subcapa de catálogo, de datos técnicos y después, para modelar la capa de acceso al dato en base a entidades de negocio y semántica, se usan ontologías. Para ello se usan herramientas como herramientas ETL (del inglés “Extract, Transform and Load”, Extraer, Transformar y Cargar, que es un proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos), Micro servicios, Herramientas de Inteligencia de Negocio, de Inteligencia artificial o de Machine Learning y cualquier otro tipo de herramienta de datos.Figure 1 shows a model of said layer according to an embodiment of the invention. In it, it is seen that there is a catalog sublayer, of technical data and then, to model the data access layer based on business entities and semantics, ontologies are used. For this, tools such as ETL tools (from English "Extract, Transform and Load", Extract, Transform and Load, which is a process that allows organizations to move data from multiple sources, reformat and clean them), Micro services, Tools of Business Intelligence, Artificial Intelligence or Machine Learning and any other type of data tool.

En otras palabras, se puede decir que la invención propuesta permite crear y explotar datos organizados, preferiblemente, en tablas semánticas. Estas tablas, a priori idénticas a las tablas de esquemas físicos reales, son la representación de negocio de los objetos definidos y se pueden entender como vistas virtualizadas de las estructuras originales de datos. Esto permite desacoplar todos los procesos que explotan los datos de los modelos de físicos de datos y hacerlos portátiles en diferentes escenarios. La combinación de procesos junto con la definición semántica (a través de ontologías) hace que el modelo de datos y los procesos que se ejecutan en él sean reutilizables y portátiles; estos procesos incluyen procesamiento de datos, modelos de aprendizaje automático (en inglés machine learning), herramientas de Información de Negocios... o cualquiera otros. El mecanismo propuesto comprende un conjunto de algoritmos, procesos, componentes y herramientas que permiten mejorar la gestión y el acceso a datos con las ventajas que se han comentado previamente; permitiendo además obtener ei mayor valor posible del uso y explotación de ios datos.In other words, it can be said that the proposed invention makes it possible to create and exploit data organized, preferably, in semantic tables. These tables, a priori identical to the real physical schema tables, are the business representation of the defined objects and can be understood as virtualized views of the original data structures. This allows to decouple all the processes that exploit the data from the physical data models and make them portable in different scenarios. The combination of processes together with the semantic definition (through ontologies) makes the data model and the processes that run on it reusable and portable; These processes include data processing, machine learning models, Business Information tools ... or any other. The proposed mechanism comprises a set of algorithms, processes, components and tools that allow to improve the management and access to data with the advantages that have been previously commented; also allowing to obtain the highest possible value from the use and exploitation of the data.

La figura 2 muestra de manera esquemática algunas de las principales fases de la solución propuesta, que explicaremos a continuación. Como se ve, para el cruce de datos se pueden usar formatos standard como, por ejemplo, SQL (del inglés, “Structured Query Language”, Lenguaje Estructurado de Consulta) o API RestFul (Aplicaciones que cumplen los requisitos REST (del inglés, Representational State Transfer, Transferencia de estado representacional), o cualquier otro conocido.Figure 2 schematically shows some of the main phases of the proposed solution, which we will explain below. As can be seen, standard formats such as SQL (Structured Query Language) or RestFul API (Applications that meet REST requirements (Representational State Transfer, Representational State Transfer), or any other known.

En una realización, la solución propuesta se compone de las siguientes fases/tareas (esto es solo un ejemplo no limitativo y no todas las fases son obligatorias en todas las implementaciones de la presente invención). Al elemento funcional (procesador o conjunto de procesadores electrónicos) que realiza esta tarea se le puede llamar de manera genérica agente:In one embodiment, the proposed solution is composed of the following phases / tasks (this is only a non-limiting example and not all phases are mandatory in all implementations of the present invention). The functional element (processor or set of electronic processors) that performs this task can be generically called agent:

Fase de descubrimiento automático: En esta primera fase se determinan (descubren) los datos y, preferiblemente, los modelos técnicos (por ejemplo, características técnicas de los datos o metadatos técnicos) del sistema de información. Para ello se utiliza, por ejemplo:Automatic discovery phase: In this first phase, the data and preferably the technical models (for example, technical characteristics of the data or technical metadata) of the information system are determined (discovered). For this you use, for example:

• Un conjunto de agentes (mediante algoritmos y herramientas informáticas adecuadas) que de forma automática y en tiempo real realizan dicho descubrimiento.• A set of agents (using appropriate computer tools and algorithms) that automatically and in real time carry out said discovery.

• Un repositorio (base de datos) donde se almacena dichos modelos técnicos para su posterior uso desde la capa de datos propuesta (business data layer).• A repository (database) where these technical models are stored for later use from the proposed data layer (business data layer).

• Un conjunto de herramientas (informáticas) que permiten explotar dichos modelos técnicos para obtener, más adelante, los conceptos deseados.• A set of (computer) tools that allow the exploitation of these technical models to obtain, later on, the desired concepts.

Después viene una fase de definición de modelos de negocio (también llamado modelo de explotación de la información), preferiblemente mediante el uso de ontologías. En esta fase es especialmente importante el uso de un algoritmo automático de conversión de un modelo puramente ontológico y de conocimiento a un modelo ontológico orientado a la explotación de la información. Dicho proceso de conversión es clave para poder permitir que herramientas empresariales estándares exploten la información de forma semántica. En la figura 3, se muestra un ejemplo del transformación de modelos ontológicos, realizado por un algoritmo de forma automática, y que se ejecuta en el” Business Data Layer” para permitir que un dominio ontológico pueda ser expuesto y consumido por herramientas de explotación del dato estándares y empresariales. En el ejemplo propuesto se usan técnicas FIBO para obtener los conceptos deseados (por ejemplo, cuenta) con las propiedades correspondientes (fecha de apertura de la cuenta, fecha de cierre, cantidad de dinero en la cuenta...). FIBO (Financial Industry Business Ontology, Ontología de Negocios de Industria Financiera) es un modelo conceptual que define como los instrumentos financieros, las entidades de negocio y los procesos trabajan y se influyen conjuntamente en la industria; permite una armonización de los datos entre distintas bases de datos y permite trasladar conceptos precisos y detallados a un lenguaje común entre sistemas y fuentes de datos. Los conceptos representan generalmente el elemento más pequeño con significado.Then comes a phase of defining business models (also called the information exploitation model), preferably through the use of ontologies. In this phase, the use of an automatic algorithm for the conversion of a purely ontological and knowledge model to an ontological model oriented to the exploitation of information is especially important. This conversion process is key to allowing standard business tools to exploit information semantically. In figure 3, an example of the transformation of ontological models is shown, carried out by an algorithm automatically, and which is executed in the "Business Data Layer" to allow an ontological domain to be exposed and consumed by tools for the exploitation of the standard and business data. In the proposed example, FIBO techniques are used to obtain the desired concepts (for example, account) with the corresponding properties (account opening date, closing date, amount of money in the account ...). FIBO (Financial Industry Business Ontology) is a conceptual model that defines how financial instruments, business entities and processes work and influence each other in the industry; It allows a harmonization of the data between different databases and allows to transfer precise and detailed concepts to a common language between systems and data sources. Concepts generally represent the smallest element with meaning.

Fase de asignación automática de significado: En esta fase se asigna (mapea) de manera automática un significado (concepto) relacionado con el negocio que se está desarrollando (definido mediante los conceptos de negocio obtenidos en la fase anterior) a los datos técnicos de entrada. Para ello, en una realización, se usan patrones de datos para los distintos conceptos; estos patrones definen las características (“forma”) que debe tener un dato para asignarlo a un concepto. Idealmente, se debería obtener el “patrón de datos perfecto” donde hay definiciones para para todos los datos objetivos sin dejar casi ningún dato fuera. Este patrón de datos sería casi imposible de obtener con datos reales.; además los datos de entrada pueden tener diferentes formas que si se acoplan al patrón lo pueden hacer demasiado específico.Automatic meaning assignment phase: In this phase, a meaning (concept) related to the business being developed (defined by the business concepts obtained in the previous phase) is automatically assigned (mapped) to the input technical data . To do this, in one embodiment, data patterns are used for the various concepts; These patterns define the characteristics ("form") that a piece of data must have to assign it to a concept. Ideally, the “perfect data pattern” should be obtained where there are definitions for all the objective data with hardly any data left out. This pattern of data would be almost impossible to obtain with real data; moreover, the input data can have different forms that if they are coupled to the pattern they can make it too specific.

En la práctica, si el patrón de datos es demasiado específico, solo abarcará alguno de los datos; esto hará que muchos datos no se admitan en el sistema, que se pierdan emparejamientos buenos y que no se puedan hacer chequeos de calidad. Si el patrón de datos es demasiado genérico, se abarcan todos los datos pero a base de ofrecer una mala calidad en la asignación y de que el sistema dude mucho y el mapeo no sea robusto, al ser el patrón tan genérico. Estos problemas los resuelve la solución propuesta, ya que permite obtener un patrón de datos adecuado, ni muy genérico ni muy específico. Gracias a este patrón de datos adecuado, la mayor parte de los datos no adecuados se bloquean y no se admiten en el sistema, se realizan buenas decisiones de mapeo ya que hay suficiente información para dicho mapeo (asignación), se minimiza el riesgo al admitir nuevos datos y se realizan chequeos de calidad realistas:In practice, if the data pattern is too specific, it will only cover some of the data; This will cause a lot of data to be unsupported by the system, good matches lost, and quality checks not possible. If the data pattern is too generic, all the data is covered, but on the basis of offering poor quality in the assignment and that the system is very hesitant and the mapping is not robust, as the pattern is so generic. These problems are solved by the proposed solution, since it allows obtaining an adequate data pattern, neither very generic nor very specific. Thanks to this proper data pattern, most of the unsuitable data is blocked and not supported in the system, good mapping decisions are made as there is enough information for such mapping (allocation), risk is minimized by admitting new data and realistic quality checks are performed:

Para realizar esta asignación de significados o conceptos (también llamado mapeo de datos a significados de negocio) se usan diferentes técnicas como las que se definen a continuación (algunas de ellas relacionadas con el uso de inteligencia artificial o aprendizaje automático):To carry out this assignment of meanings or concepts (also called mapping data to business meanings), different techniques are used, such as those defined below (some of them related to the use of artificial intelligence or machine learning):

- Emparejamiento de conceptos (del inglés “concept matching”): Para esto se pueden seguir dos enfoques: el primero es el emparejamiento directo (DM, del inglés “Direct Matching”) para el que se usa técnicas de perfiles (en inglés “profiling”) y el segundo el emparejamiento de Conocimiento General (GKM, del inglés “General Knowledge Matching”) que permite al sistema escalar pero seguir aprendiendo.- Concept matching: For this, two approaches can be followed: the first is Direct Matching (DM) for which profiling techniques are used. ”) And the second is the General Knowledge Matching (GKM) that allows the system to scale but continue learning.

Los conceptos que hay que emparejar (mapear) pueden ser de cualquier tipo: por ejemplo en el caso de coches, ruedas, propietario, matrícula... y en el caso de personas el nombre, la dirección, la fecha de nacimiento...The concepts to be matched (mapped) can be of any type: for example in the case of cars, wheels, owner, license plate ... and in the case of people the name, address, date of birth ...

En la técnica del emparejamiento directo, se traza un perfil de los datos entrantes que se quieren mapear usando reglas de calidad, para ello se usa una muestra (aleatoria) de datos que sea suficientemente significativa (es decir, que se usa una cantidad considerable de muestras de los datos de entrada). En una realización se sigue un enfoque bayesiano (aunque se pueden usar otras técnicas estadísticas) para tener una certeza suficiente de cómo de bien unos determinados datos (por ejemplo, una columna de datos de los datos de entrada) describen una propiedad de la ontología; de esta manera, centrándose en cada concepto que se quiera mapear, se hace una estimación de cómo de bien (es decir, con qué probabilidad) los datos agrupados reflejan dicho concepto.In the direct matching technique, a profile of the incoming data to be mapped is drawn using quality rules, for which a (random) sample of data is used that is sufficiently significant (that is, a considerable amount of samples of the input data). In one embodiment a Bayesian approach is followed (although other statistical techniques can be used) to have sufficient certainty of how well certain data (eg, a column of data from the input data) describe a property of the ontology; In this way, focusing on each concept to be mapped, an estimate is made of how well (that is, with what probability) the grouped data reflects that concept.

Así, para trazar los perfiles se pueden usar patrones de ontología de negocios; parámetros estadísticos obtenidos de los datos pueden ser procesados para trazar los perfiles y ser la entrada de la siguiente capa. Por ejemplo, se pueden calcular las probabilidades de que los datos de una columna describan un concepto/propiedad de determinado y se puede calcular la probabilidad de que una tabla de datos contenga datos correspondientes a un determinado concepto/propiedad (por ejemplo, nombre, código postal, precios...).Thus, to draw the profiles, business ontology patterns can be used; Statistical parameters obtained from the data can be processed to draw the profiles and be the input of the next layer. For example, you can calculate the probabilities that the data in a column describe a certain concept / property and the probability that a data table contains data corresponding to a certain concept / property (for example, name, postal code, prices ...) can be calculated .

- Escalamiento: El escalamiento para el mapeo de datos, en una realización se hace mediante técnicas de Emparejamiento genérico (Generic Matching) y/o de identificación por características (en inglés, “fingerprinting”). En esta realización se usan patrones genéricos y “fingerprinting” previo de datos etiquetados. El sistema puede mantener un espacio vectorial con incrustaciones/embebimiento (en inglés, “embedding”) de patrones (que podría ser forzado a ser euclidiano). El patrón de cada grupo de datos (por ejemplo, una columna de la tabla) se calcula sobre una muestra aleatoria. La coincidencia con el patrón puede optimizarse para distintos parámetros de diseño (por ejemplo, para un tiempo de retorno inferior al milisegundo). A veces, es necesaria una traducción de las dimensiones ya que los vectores pueden provenir de espacios vectoriales diferentes con distintas dimensiones (espacio del cliente vs. espacio genérico usado en el mapeo).- Scaling: Scaling for data mapping, in one embodiment, is done using Generic Matching and / or identification by characteristics (“fingerprinting”) techniques. In this embodiment, generic patterns and prior fingerprinting of tagged data are used. The system can maintain a vector space with embedding (in English, "embedding") of patterns (which could be forced to be Euclidean). The pattern for each group of data (for example, a column in the table) is calculated on a random sample. Pattern matching can be optimized for different design parameters (for example, a return time of less than a millisecond). Sometimes, a translation of the dimensions is necessary since the vectors can come from different vector spaces with different dimensions (client space vs. generic space used in the mapping).

Para poder extraer un significado específico de datos generales, el sistema mantiene un crecimiento continuo de índice multidimensional, trazando formas de datos que apuntan a un significado real, en el que: Los objetivos son conceptos; las dimensiones tienen incrustaciones con formas de datos transformadas, dispuestas de forma jerárquica; el tipo de índice en sí mismo acelera búsquedas en varios órdenes de magnitud frente a una clásica comparación de vectores.In order to extract a specific meaning from general data, the system maintains a continuous growth of multidimensional index, tracing data forms that point to a real meaning, in which: The objectives are concepts; dimensions are embedded with transformed data shapes, arranged hierarchically; the index type itself speeds up searches by several orders of magnitude versus a classic vector comparison.

- Ayuda Humana: Una vez tomadas las decisiones de emparejamiento entre conjuntos de datos y conceptos, algunas de ellas pueden tener una baja certeza o baja probabilidad. Entonces, en una realización, se puede requerir la intervención de un humano (por ejemplo, un operario) para validar la decisión tomada, rechazar las decisiones más débiles e incluso corregir las decisiones creando asociaciones nuevas entre los datos y los conceptos.- Human Help: Once the matching decisions between data sets and concepts have been made, some of them may have low certainty or low probability. Then, in one embodiment, the intervention of a human (for example, an operator) may be required to validate the decision made, reject the weaker decisions and even correct the decisions by creating new associations between the data and the concepts.

- Crecimiento (mejora) del comportamiento mediante el uso de escenarios: Para realizar esta optimización, no solo hay que obtener los escenarios sino también evaluarlos y hacer múltiples tests. Para la evaluación, en una realización, se pueden usar dos tipos de métricas: de Recuerdo (también llamado sensibilidad, fracción de la cantidad total de resultados relevantes que han sido correctamente encontrados) y Precisión (fracción de los resultados relevantes dentro de los encontrados) Por ejemplo en un caso en que se hacen pruebas médicas habrá falsos negativos (y dentro de los falsos negativos habrá verdaderos positivos) y habrá verdaderos negativos (y dentro de los verdaderos negativos habrá falsos positivos). En este caso si se definen los resultados relevantes como los positivos verdaderos, se puede definir la precisión como los positivos verdaderos sobre los positivos totales (verdaderos y falsos) y el recuerdo o sensibilidad como los positivos verdaderos sobre los falsos negativos totales.- Growth (improvement) of the behavior through the use of scenarios: To perform this optimization, it is not only necessary to obtain the scenarios but also evaluate them and do multiple tests. For the evaluation, in one embodiment, two types of metrics can be used: Recall (also called sensitivity, fraction of the total amount of relevant results that have been correctly found) and Accuracy (fraction of the relevant results within those found) For example, in a case in which medical tests are carried out there will be false negatives (and within the false negatives there will be true positives) and there will be true negatives (and within the true negatives there will be false positives). In this case, if the relevant results are defined as true positives, precision can be defined as true positives over total positives (true and false) and recall or sensitivity as true positives over total false negatives.

Así, con el fin de seguir entrenando y aumentando las capacidades del agente de mapeo, en una realización se utilizan utiliza un conjunto de escenarios predefinidos. Cada escenario puede comprender la estructura de datos (estructura de tabla/archivo), los datos de perfil inicial dados y el resultado esperado. Los escenarios pueden ser construidos manualmente pero también registrados desde el sistema para su futuro uso.Thus, in order to further train and increase the capabilities of the mapping agent, in one embodiment a set of predefined scenarios are used. Each scenario can comprise the data structure (table / file structure), the initial profile data given, and the expected result. Scenarios can be built manually but also registered from the system for future use.

Los escenarios predefinidos proporcionan los elementos básicos para: añadir nuevas capacidades (cada nueva capacidad añadida requiere la adición de los nuevos escenarios correspondientes y la garantía de que se mantienen los antiguos); definir explícitamente cómo se comporta cada escenario (por ejemplo, respondiendo los “qué/porqués” en el sistema); probar el sistema (por ejemplo, proveyendo un mecanismo para ejecutar pruebas funcionales y de regresión); intercambiar opiniones/comportamientos con los clientes (los clientes pueden definir sus propios escenarios para validarlos antes de su uso y pueden capturar los escenarios actuales propuestos por el sistema que ayudan a resolver los problemas).Predefined scenarios provide the basic elements to: add new capabilities (each new added capability requires the addition of the corresponding new scenarios and the assurance that the old ones are maintained); explicitly define how each scenario behaves (for example, answering the "what / why" in the system); test the system (for example, by providing a mechanism to run functional and regression tests); exchange opinions / behaviors with customers (customers can define their own scenarios to validate before use and can capture current scenarios proposed by the system that help solve problems).

- Para la mejora del mapeo se puede usar un algoritmo de convergencia estadística a través del refuerzo. Este algoritmo comprende la construcción de un matriz de perfiles que muestra cómo de bien que los patrones de datos coinciden con los datos. La matriz se construye usando los datos de la tabla de datos y los patrones correspondientes. Cada fila de la matriz se refiere a los patrones (QRs) y las columnas se refieren a los datos (específicamente en una realización a las columnas de la tabla). En una realización cada celda de la matriz muestra un color que depende de cómo de bien los datos siguen el patrón. Normalmente, los patrones y las columnas están organizadas simétricamente de modo que la diagonal de la matriz representa el cumplimiento del tándem columna/patrón. Mediante este algoritmo se puede mejorar el algoritmo de emparejamiento, haciendo que por ejemplo se adapte mejor al posible ruido existente. Fase de la materialización (construcción) de la capa de datos principal, la capa de datos de negocio (BDL, del inglés “Business data Layer”): En esta fase se crea la capa de datos en base a la definición realizada (mediante las ontologías), y al mapeo realizado de forma automática o manual en la fase anterior. Dicha materialización (construcción) de la capa de datos se realiza mediante un conjunto de herramientas y algoritmos apropiados, a partir de la información de mapeo almacenada y los modelos técnicos auto descubiertos en la primera fase. Mediante esta capa, se permite el acceso a los datos (asociados/convertidos a conceptos) tanto para uso operacional como informacional en la aplicación concreta en la que se quieran explotar los datos.- To improve the mapping, an algorithm of statistical convergence through reinforcement can be used. This algorithm comprises the construction of a profile matrix that shows how well the data patterns match the data. The matrix is constructed using the data from the data table and the corresponding patterns. Each row of the matrix refers to the patterns (QRs) and the columns refer to the data (specifically in one embodiment to the columns of the table). In one embodiment, each cell in the matrix displays a color that depends on how well the data follows the pattern. Typically the patterns and columns are arranged symmetrically so that the diagonal of the matrix represents the fulfillment of the column / pattern tandem. By means of this algorithm, the matching algorithm can be improved, for example making it better adapt to possible existing noise. Phase of the materialization (construction) of the main data layer, the business data layer (BDL, from the English “Business data Layer”): In this phase the data layer is created based on the definition made (by means of the ontologies), and the mapping performed automatically or manually in the previous phase. Said materialization (construction) of the data layer is carried out by means of a set of appropriate tools and algorithms, starting from the stored mapping information and the technical models that were self-discovered in the first phase. Through this layer, access to the data (associated / converted to concepts) is allowed for both operational and informational use in the specific application in which the data is to be exploited.

Fase de consistencia de datos de negocio: En esta fase se gestiona la consistencia automática del sistema de información; se hace en base a las entidades de negocio definidas mediante ontologías y, normalmente, gestionadas mediante dominios. Para ello, en una realización, se realizan réplica de los datos en distintas bases de datos (de cliente, de producto...); dichos datos se pueden recoger del interfaz de usuario de los distintos clientes por ejemplo a través de aplicaciones apropiadas (por ejemplo, aplicaciones que cumplen los requisitos REST).Business data consistency phase: In this phase, the automatic consistency of the information system is managed; it is based on the business entities defined through ontologies and, normally, managed through domains. For this, in one embodiment, data is replicated in different databases (customer, product ...); such data can be collected from the user interface of different clients for example through appropriate applications (eg applications that meet REST requirements).

Fases de Control de Acceso v Gobierno de los datos: En estas fases, se realiza el control del acceso a los datos y del gobierno (gestión) de los mismos mediante la definición de reglas de acceso y atributos de gobierno respectivamente definidas sobre los modelos de negocio ontológicos; para ello se utiliza un conjunto de herramientas (principalmente software) que permiten definir y llevar a cabo las distintas reglas de acceso a los datos y atributos de gobierno de los mismos, que se deseen implantar. Por ejemplo, se puede definir para cada tipo de concepto o dato, quien puede acceder (el propietario de los datos, agentes externos), quien los gestiona, que operaciones pueden hacer (modificarlos, leerlos, compartirlos, enviarlos a una entidad externa, control de calidad...), que categoría de seguridad tienen... y cualquier otra regla de acceso o atributo de gobierno de los datos que se desee implementar.Access Control and Data Governance Phases: In these phases, control of access to data and its governance (management) is carried out by defining access rules and governance attributes respectively defined on the data models. ontological business; For this, a set of tools (mainly software) is used that allow to define and carry out the different access rules to the data and its governance attributes, which are to be implemented. For example, you can define for each type of concept or data, who can access (the owner of the data, external agents), who manages them, what operations they can do (modify them, read them, share them, send them to an external entity, control quality ...), what security category they have ... and any other access rule or data governance attribute that you want to implement.

Resumiendo, gracias a las fases antes descritas se puede crear una capa de datos (semántica) y desarrollar y reutilizar software basado en dicha capa de datos. La creación de la capa semántica incluye:In summary, thanks to the phases described above, it is possible to create a data layer (semantics) and develop and reuse software based on said data layer. The creation of the semantic layer includes:

Conceptualización o creación de los conceptos en los que se trabajará (clientes, proveedores, empleados... o cualquier otro) en la aplicación particular. La creación de patrones de datos para los conceptos donde cada patrón describe las características (o generalmente hablando, la “forma”) que los datos deben tener para que pertenezcan a un determinado concepto (por lo tanto, los patrones están asociados a los conceptos). Esto se hace preferiblemente de manera automática (como se describe en la fase de asignación de significado), pero también se puede hacer de manera manual o una combinación de ambas técnicas.Conceptualization or creation of the concepts that will be worked on (clients, suppliers, employees ... or any other) in the particular application. The creation of data patterns for the concepts where each pattern describes the characteristics (or generally speaking, the “shape”) that the data must have in order to belong to a certain concept (therefore, the patterns are associated with the concepts) . This is preferably done automatically (as described in the meaning assignment phase), but can also be done manually or a combination of both techniques.

Para realizar la asignación (también llamado asociación o conversión) de datos a conceptos, en una realización se seguirán los siguientes pasos: definir y almacenar uno o varios escenarios a partir de los datos de entrada disponibles; definir o adquirir uno o más modelos conceptuales (conceptos) y almacenarlos; relacionar, opcionalmente de manera automática, cada uno de los escenarios de datos con uno o más de los modelos conceptuales; almacenar dichas relaciones.To carry out the assignment (also called association or conversion) of data to concepts, in one embodiment the following steps will be followed: define and store one or more scenarios from the available input data; define or acquire one or more conceptual models (concepts) and store them; relate, optionally automatically, each of the data scenarios with one or more of the conceptual models; store those relationships.

Una vez que los datos se asocian a conceptos, la capa de datos expone los datos siguiendo la forma del concepto. Se hace una abstracción del significado de los datos (se puede ver como una virtualización de los datos), convirtiéndolos en conceptos que pueden ser directamente usados por el software de la aplicación correspondiente. Se puede decir que el software consume conceptos y que las estructuras subyacentes que soportan esos conceptos (por ejemplo, que asocian los datos a los conceptos) o los detalles técnicos de los datos son transparentes para el software.After the data is associated with concepts, the data layer exposes the data in the form of the concept. The meaning of the data is abstracted (it can be seen as a virtualization of the data), turning it into concepts that can be directly used by the corresponding application software. It can be said that the software consumes concepts and that the underlying structures that support those concepts (for example, that associate the data with the concepts) or the technical details of the data are transparent to the software.

Esto hace que este software sea reutilizable ya que se puede usar el mismo software en datos nuevos aunque tengan diferente estructura, sean diferentes técnicamente o aunque sean de diferente naturaleza ya que el sistema propuesto hace todo eso transparente al software. Para ello, el sistema propuesto automáticamente busca patrones en los que encajen los nuevos datos, asociando los nuevos datos a conceptos; de hecho, como ya se ha explicado, el sistema propuesto decide cual es el mejor emparejamiento entre datos y conceptos (e incluso puede decidir que no hay emparejamiento).This makes this software reusable since the same software can be used in new data even if they have a different structure, are technically different or even if they are of a different nature since the proposed system makes all of this transparent to the software. For this, the proposed system automatically looks for patterns in which the new data fit, associating the new data with concepts; in fact, as already explained, the proposed system decides which is the best match between data and concepts (and may even decide that there is no match).

Las asignaciones realizadas se aplican para exponer los datos (ya asociados a conceptos en la capa semántica) y, a partir de aquí, los datos pueden ser usados por cualquier software (cualquier aplicación) que trabaja con los mismos conceptos. La solución propuesta también permite rastrear y reportar los datos asociados a un con cepto de negocio. Para ello en una realización se llevan a cabo los siguientes pasos: pro porcionar una manera de interpretar los datos utilizando patrones; dichos patrones son al menos uno de los siguientes: patrón de datos, relaciones, agrupaciones, nombres, meta- datos asociados y similitud con datos ya interpretados; vincular dicha interpretación a conceptos (de negocio); almacenar dicho vínculo en un formato que permita realizar consultas/búsquedas (dicho formato que permita realizar consultas puede ser un índice, datos brutos, Marco de descripción de recursos RDF, o cualquier otro); consultar/buscar los datos relacionados con un determinado concepto de negocios. Algo análogo se puede usar para rastrear y reportar el significado comercial de un conjunto de datos, consultando/buscando conceptos relacionados con cualquier conjunto de datos.The assignments made are applied to expose the data (already associated with concepts in the semantic layer) and, from here, the data can be used by any software (any application) that works with the same concepts. The proposed solution also allows the data associated with a business concept to be tracked and reported. For this, in one embodiment, the following steps are carried out: providing a way to interpret the data using patterns; said patterns are at least one of the following: pattern of data, relationships, groupings, names, associated metadata and similarity with data already interpreted; link said interpretation to (business) concepts; store said link in a query / search format (said query format can be an index, raw data, RDF resource description framework, or any other); consult / search the data related to a certain business concept. Something analogous can be used to track and report the business significance of a data set, querying / searching for concepts related to any data set.

La solución propuesta también permite replicar datos por su significado. Para ello en una realización se llevan a cabo los siguientes pasos: vincular los datos a conceptos (de negocio); permitir la publicación de conceptos y sus datos asociados; permitir que un mecanismo se suscriba a los conceptos desde un sistema remoto; permitir la posibilidad de replicar datos, en el sistema remoto, que está asociado a los conceptos suscritos. Dicha réplica tiene la capacidad opcional de mantener la coherencia de los datos; dicha coherencia garantizaría al menos que los datos se escriban en el mismo orden en que son creados.The proposed solution also allows data to be replicated by its meaning. For this, in one embodiment, the following steps are carried out: linking the data to (business) concepts; allow the publication of concepts and their associated data; allow a mechanism to subscribe to concepts from a remote system; allow the possibility of replicating data, in the remote system, which is associated with the subscribed concepts. Such a replica has the optional ability to maintain data consistency; Such consistency would at least ensure that the data is written in the same order in which it is created.

Obsérvese que en este texto, términos relaciónales como primero y segundo, superior e inferior y similares, pueden ser usados únicamente para distinguir una entidad o acción de otra, sin necesariamente requerir o implicar realmente esa relación u orden entre dichas entidades o acciones. Además, el término “comprende” y sus derivaciones (tales como “comprendiendo”, etc.) no deberían ser entendidos en un sentido de exclusión, es decir, estos términos no deberían ser interpretados como excluyentes de la posibilidad de que lo que se describe y define pueda incluir elementos, etapas, etc., adicionales.Note that in this text, relational terms such as first and second, superior and inferior, and the like, can only be used to distinguish one entity or action from another, without necessarily requiring or actually implying that relationship or order between said entities or actions. Furthermore, the term "comprises" and its derivations (such as "understanding", etc.) should not be understood in a sense of exclusion, that is, these terms should not be interpreted as excluding the possibility that what is described and define can include additional elements, stages, etc.

Algunas realizaciones preferidas de la invención se describen en las reivindicaciones que se incluyen seguidamente.Some preferred embodiments of the invention are described in the claims that follow.

Descrita suficientemente la naturaleza de la invención, así como la manera de realizarse en la práctica, hay que hacer constar la posibilidad de que sus diferentes partes podrán fabricarse en variedad de materiales, tamaños y formas, pudiendo igualmente introducirse en su constitución o procedimiento, aquellas variaciones que la práctica aconseje, siempre y cuando las mismas, no alteren el principio fundamental de la presente invención. La descripción y los dibujos simplemente ilustran los principios de la invención. Por lo tanto, debe apreciarse que los expertos en la técnica podrán concebir varias disposiciones que, aunque no se hayan descrito o mostrado explícitamente en este documento, representan los principios de la invención y están incluidas dentro de su alcance. Además, todos los ejemplos descritos deben considerarse como no limitativos con respecto a tales ejemplos y condiciones descritos de manera específica. Además, todo lo expuesto en este documento relacionado con los principios, aspectos y realizaciones de la invención, así como los ejemplos específicos de los mismos, abarcan equivalencias de los mismos.Having sufficiently described the nature of the invention, as well as the way in which it is carried out in practice, it should be noted the possibility that its different parts may be manufactured in a variety of materials, sizes and shapes, and may also be introduced in its constitution or procedure, those variations that practice advises, as long as they do not alter the fundamental principle of the present invention. The description and drawings simply illustrate the principles of the invention. Therefore, it should be appreciated that those skilled in the art will be able to devise various arrangements which, although not explicitly described or shown herein, represent the principles of the invention and are included within its scope. Furthermore, all of the described examples are to be considered as non-limiting with respect to such specifically described examples and conditions. Furthermore, everything set forth in this document related to the principles, aspects and embodiments of the invention, as well as the specific examples thereof, encompass equivalences thereof.

Claims

Translated fromSpanish
REIVINDICACIONES1. Método implementado por ordenador para mejorar la gestión y el acceso a información para su explotación, donde el método comprende los siguientes pasos realizados por uno o más procesadores electrónicos: a) Descubrir un conjunto de datos de entrada y las características técnicas de datos de dicho conjunto de datos de entrada; b) Definir un conjunto de conceptos para la explotación de la información contenida por el conjunto de datos de entrada; c) Asignar a datos del conjunto de datos de entrada al menos uno de los conceptos definidos, en base al valor y/o las características técnicas de los datos y almacenar dicha asignación en una o más bases de datos; d) Permitir el acceso a los conceptos asignados correspondientes al conjunto de datos de entrada, por parte de uno o más sistemas electrónicos y/o procesos de explotación de los datos de entrada; donde para dicho acceso se aplican una o más reglas de control de acceso previamente definidas.1. Computer-implemented method to improve the management and access to information for its exploitation, where the method comprises the following steps carried out by one or more electronic processors: a) Discover a set of input data and the technical characteristics of data from said input data set; b) Define a set of concepts for the exploitation of the information contained by the input data set; c) Assigning to data from the input data set at least one of the defined concepts, based on the value and / or technical characteristics of the data and storing said assignment in one or more databases; d) Allow access to the assigned concepts corresponding to the input data set, by one or more electronic systems and / or input data exploitation processes; where one or more previously defined access control rules are applied for said access.2. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde la definición de conceptos se realiza mediante el uso de ontologías.2. Method according to any of the preceding claims where the definition of concepts is done through the use of ontologies.3. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde el paso c) comprende: almacenar uno o varios escenarios a partir del conjunto de datos de entrada; definir o adquirir uno o más conceptos y almacenarlos; relacionar cada uno de los escenarios de datos con uno o más conceptos; almacenar dichas relaciones.3. Method according to any of the preceding claims, where step c) comprises: storing one or more scenarios from the input data set; define or acquire one or more concepts and store them; relate each of the data scenarios to one or more concepts; store those relationships.4. Método de acuerdo a la reivindicación 3, donde cada escenario comprende estructuras de datos, datos de perfil inicial y el resultado esperado.4. Method according to claim 3, where each scenario comprises data structures, initial profile data and the expected result.5. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde la asignación de datos a conceptos en el paso c) se realiza usando patrones para cada concepto, que definen las características que debe tener un dato para asignarlo a un determinado concepto.5. Method according to any of the preceding claims where the assignment of data to concepts in step c) is carried out using patterns for each concept, which define the characteristics that a data must have to assign it to a certain concept.6. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde en el paso d) también incluye: Permitir la gestión de los conceptos asignados correspondientes al conjunto de datos de entrada, por parte de uno o más sistemas electrónicos y/o procesos de explotación de los datos de entrada; donde dicha gestión se realiza de acuerdo a uno o más atributos de gobierno previamente definidos.6. Method according to any of the preceding claims where in step d) it also includes: Allowing the management of the assigned concepts corresponding to the input data set, by one or more electronic systems and / or processes of exploitation of the input data; where said management is carried out according to one or more previously defined governance attributes.7. Método de acuerdo a cualquiera de las reivindicaciones anteriores, donde tras el paso c) se realiza una comprobación de la consistencia de la información almacenada.7. Method according to any of the preceding claims, wherein after step c) a check of the consistency of the stored information is performed.8. Método de acuerdo a la reivindicación 7, donde la consistencia se comprueba en base a entidades de negocio definidas mediante ontologías.8. Method according to claim 7, where consistency is checked based on business entities defined by ontologies.9. Método de acuerdo a cualquiera de las reivindicaciones anteriores, donde el descubrimiento del conjunto de datos de entrada se realiza recibiendo dicho conjunto de datos a través de una red de comunicación.9. Method according to any of the preceding claims, wherein the discovery of the input data set is performed by receiving said data set through a communication network.10. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde en el paso a) como partes de las características técnicas se descubren los modelos técnicos que siguen los datos del conjunto de datos de entrada y/o metadatos técnicos de los datos del conjunto de datos de entrada.10. Method according to any of the preceding claims where in step a) as parts of the technical characteristics the technical models that follow the data of the input data set and / or technical metadata of the data of the data set are discovered input.11. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde la asignación de datos a conceptos en el paso c) comprende el uso de un algoritmo de convergencia estadística mediante refuerzo.Method according to any of the preceding claims, where the assignment of data to concepts in step c) comprises the use of a statistical convergence algorithm by means of reinforcement.12. Método de acuerdo a cualquiera de las reivindicaciones anteriores, donde en el paso d) se permite el acceso a los conceptos por parte de uno o más sistemas electrónicos y/o procesos de explotación de los datos de entrada, usando un lenguaje estructurado de consultas, SQL.12. Method according to any of the preceding claims, where in step d) access to the concepts is allowed by one or more electronic systems and / or processes of exploitation of the input data, using a structured language of queries, SQL.13. Método de acuerdo a cualquiera de las reivindicaciones anteriores donde en el paso b) para definir los conceptos deseados se usa una técnica basada en técnicas de Ontología de Negocios de Industria Financiera, FIBO.13. Method according to any of the preceding claims where in step b) to define the desired concepts a technique based on techniques of Financial Industry Business Ontology, FIBO, is used.14. Sistema para mejorar la gestión y el acceso a información para su explotación, donde el sistema comprende uno o más procesadores electrónicos configurados para:14. System to improve the management and access to information for its exploitation, where the system comprises one or more electronic processors configured to:- Descubrir un conjunto de datos de entrada y las características técnicas de dichos datos;- Discover a set of input data and the technical characteristics of said data;- Definir un conjunto de conceptos para la explotación de la información contenida por el conjunto de datos de entrada;- Define a set of concepts for the exploitation of the information contained by the input data set;- Asignar a datos del conjunto de datos de entrada al menos uno de los conceptos definidos, en base al valor y/o las características técnicas de los datos y almacenar dicha asignación en una o más bases de datos;- Assigning to data from the input data set at least one of the defined concepts, based on the value and / or technical characteristics of the data and storing said assignment in one or more databases;- Permitir el acceso a los conceptos asignados correspondientes al conjunto de datos de entrada, por parte de uno o más sistemas electrónicos y/o procesos de explotación de los datos de entrada; donde para dicho acceso se aplican una o más reglas de control de acceso previamente definidas.- Allow access to the assigned concepts corresponding to the input data set, by one or more electronic systems and / or processes of exploitation of the input data; where one or more previously defined access control rules are applied for said access.15. Medio de almacenamiento digital para almacenar un programa de ordenador que comprende instrucciones ejecutables por ordenador que causan que un ordenador que ejecute el programa implemente el método según cualquiera de las reivindicaciones 1-13.15. Digital storage medium for storing a computer program comprising computer executable instructions that cause a computer executing the program to implement the method according to any of claims 1-13.
PCT/ES2020/0704312020-07-032020-07-03Ontology-based method and system for restricted access to dataCeasedWO2022003217A1 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
PCT/ES2020/070431WO2022003217A1 (en)2020-07-032020-07-03Ontology-based method and system for restricted access to data

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
PCT/ES2020/070431WO2022003217A1 (en)2020-07-032020-07-03Ontology-based method and system for restricted access to data

Publications (1)

Publication NumberPublication Date
WO2022003217A1true WO2022003217A1 (en)2022-01-06

Family

ID=79315614

Family Applications (1)

Application NumberTitlePriority DateFiling Date
PCT/ES2020/070431CeasedWO2022003217A1 (en)2020-07-032020-07-03Ontology-based method and system for restricted access to data

Country Status (1)

CountryLink
WO (1)WO2022003217A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2005008358A2 (en)*2003-07-222005-01-27Kinor Technologies Inc.Information access using ontologies

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2005008358A2 (en)*2003-07-222005-01-27Kinor Technologies Inc.Information access using ontologies

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "Ontology (information science)", 12 April 2017 (2017-04-12), XP055454964, Retrieved from the Internet <URL:https://en.wikipedia.org/wiki/Ontology_(information_science)> [retrieved on 20180227]*

Similar Documents

PublicationPublication DateTitle
CN104346377B (en)A kind of data integration and transfer method based on unique mark
Yue et al.A parallel and incremental approach for data-intensive learning of Bayesian networks
Abdelaal et al.Rein: A comprehensive benchmark framework for data cleaning methods in ml pipelines
CN109948710B (en) Microservice identification method based on API similarity
CN111444348A (en)Method, system and medium for constructing and applying knowledge graph architecture
Beyhl et al.On the operationalization of graph queries with generalized discrimination networks
Ayala et al.AYNEC: all you need for evaluating completion techniques in knowledge graphs
PokornýFunctional querying in graph databases
Tinelli et al.Embedding semantics in human resources management automation via SQL
Yan et al.Bibliographic name disambiguation with graph convolutional network
KrótkiewiczA novel inheritance mechanism for modeling knowledge representation systems
Fathy et al.ProGOMap: automatic generation of mappings from property graphs to ontologies
Barret et al.Exploring heterogeneous data graphs through their entity paths
Wei et al.Contextual keys
KejriwalPopulating a linked data entity name system: A big data solution to unsupervised instance matching
Sarma et al.Uncertainty in data integration and dataspace support platforms
WO2022003217A1 (en)Ontology-based method and system for restricted access to data
Christen et al.A probabilistic deduplication, record linkage and geocoding system
Reynaud et al.Redescription mining for learning definitions and disjointness axioms in linked open data
CN106897471A (en)Design idea tree templating deposition
HalpinModeling of reference schemes
SharmaDesign of formal query languages and schemas for graph databases
Lehmann et al.The geoknow handbook
SzárnyasQuery, analysis, and benchmarking techniques for evolving property graphs of software systems
Ma et al.Modeling and Management of Fuzzy Semantic RDF Data

Legal Events

DateCodeTitleDescription
121Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number:20942755

Country of ref document:EP

Kind code of ref document:A1

NENPNon-entry into the national phase

Ref country code:DE

122Ep: pct application non-entry in european phase

Ref document number:20942755

Country of ref document:EP

Kind code of ref document:A1


[8]ページ先頭

©2009-2025 Movatter.jp