Datareductie ofgegevensverwerking is de aanpassing van cijfers of teksten en andere digitaledata eninformatie naar een gecorrigeerde, geordende en vereenvoudigde vorm. Het basisconcept is het reduceren van grote hoeveelheden data tot de betekenisvolle delen door het onderdrukken vanruis (toevallige, willekeurige variaties) enuitbijters (duidelijk afwijkende en niet verklaarbare waarnemingen) en het samenvatten vanredundantie (trends en grote lijnen).
Als informatie wordt afgeleid van instrumentaflezingen, kan er ook een transformatie vananaloge naardigitale vorm zijn. Zijn de gegevens al in digitale vorm, dan heeft de 'reductie' van de gegevens meestal betrekking op het bewerken, schalen, coderen, sorteren, vergelijken en produceren van samenvattingen in tabelvorm. Als de waarnemingen discreet zijn, maar het onderliggende fenomeen continu is, zijnafvlakking eninterpolatie vaak nodig. Veelal wordt de datareductie uitgevoerd in de aanwezigheid van lees- of meetfouten. Er is een idee van de aard van deze fouten nodig voordat de meest waarschijnlijke waarde kan worden bepaald.
Een voorbeeld in deastronomie is de datareductie in deKepler-satelliet. Deze satelliet maakt eens in de zes seconden een 95-megapixel foto en genereert tientallenmegabytes aan gegevens per seconde, wat een orde van grootte is die hoger is dan de downlink-bandbreedte van 4400kbit/s. De ingebouwde datareductie omvat de toevoeging van de onbewerkte frames gedurende dertig minuten, waardoor debandbreedte met een factor 300 wordt verminderd. Bovendien worden interessante doelen vooraf geselecteerd en worden alleen de relevante pixels verwerkt, wat 6% van het totaal is. Deze gereduceerde gegevens worden vervolgens naar de aarde verzonden, waar ze verder worden verwerkt.
Er is ook onderzoek gedaan naar de toepassing van datareductie in draagbare (draadloze) apparaten voor gezondheidsmonitoring endiagnosetoepassingen. In de context van de diagnose van epilepsie bijvoorbeeld, is gegevensreductie gebruikt om de levensduur van de batterij van een draagbaar EEG-apparaat te verhogen door EEG-gegevens te selecteren die alleen relevant zijn voor de diagnose en de achtergrondactiviteit (ruis) te negeren.[1]
Veelgebruikte technieken om gegevens te reduceren, zijn: