VOLAUTOMATISCH TEKSTEN SAMENVATTEN

Vergelijkbare documenten
Proces to model en model to execute

Ongestructureerde data

Domeinbeschrijving rekenen

De eigen vermogens voor de fusie zullen opgeteld worden in het eigen vermogen na de fusie.

Microsoft Dynamics CRM & Integrated Innovation

Hardware Specialisatie. Module 1: Zoeken op het internet

Cover Page. The handle holds various files of this Leiden University dissertation.

Capaciteitentest HBO. Denkvermogen en denkstijl

Whitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon

IN 4 STAPPEN NAAR EEN DATAGEDREVEN ORGANISATIE ALLES WAT JE MOET WETEN VOOR EEN SUCCESVOLLE DATA TRANSFORMATIE

De kunst van wetenschappelijk schrijven

DE VERBORGEN WAARDE VAN DATA Toegepaste Data Intelligentie

Productinformatie LOKO Mailservice E-marketing met digitale nieuwsbrieven

De belangrijkste voordelen van de nieuwe technologie op een rijtje :

2. Syntaxis en semantiek

VERSTELBARE BROODSNIJMACHINE:

5. Vergelijkingen Vergelijkingen met één variabele Oplossen van een lineaire vergelijking

Samenvatting Proefschrift Fostering Monitoring and Regulation of Learning Mariëtte H. van Loon, Universiteit Maastricht

Taaltechnologie voor mensen met communicatieve beperkingen: een optie? Emiel Krahmer, Erwin Marsi en Lilian Beijer. Inleiding

Chris van Vleuten. Media-ondernemer trendspecialist spreker videomarketeer - ontwikkelaar van digitale concepten en formats

Inleiding Programmeren 2

Gebruiksaanwijzing ST-990 DUAL COLOR -1-

Rapport Persoonlijke Effectiviteit i360. Test Kandidaat

Begrippenlijst Inzicht in de wereld van big data, marketing en analyse

Inhoud. Introductie tot de cursus

ANP is méér dan een persbureau. ANPinOpdracht ontwikkelt en produceert content in opdracht van bedrijven. Wij brengen uw boodschap onder de aandacht.

Uitleg van de Hough transformatie

WHITEPAPER Sentiment Analyse

Computerhandleiding X985 Computerhandleiding Infiniti X

Onderzoek Online dienstverlening. Kracht van Delft 2013

KERN TALENTASSESSMENT

Vermogen. Student booklet

Rapport Docent i360. Test Kandidaat

Inzicht in energie met Go: handleiding

Oracle Portal in een Service-Oriented Architecture (SOA) ir. Jeroen F. van Schaijk Senior Consultant Emerging Technologies

Training Social Media optimaal gebruiken

Shared Data Store. Tom Demeyer, Taco van Dijk,

ALLIANDER. Neemt de wind in de zeilen en transformeert het inkoopproces

Masterclass SharePoint 2013 Advanced

DE KRACHT VAN PERSONALISATIE

Leerkrachten bevraagd

Maak de juiste keuze. Coaching. Selectie/Promotie. Management Ontwikkeling. Loopbaanbegeleiding. Copyright 2005 Alert Management Consultants

WEBSITE USABILITY. white-paper


Inleiding Programmeren 2

Communiceren in zakelijke omgevingen

Cloud Document Management & Secure Document Sharing. Nieuw bij Qwoater! Online documenten delen, archiveren en structureren voor

BIG DATA. 4 vragen over Big Data

Wat betekenen de trends tot 2020 voor shared services en bedrijfsvoering van gemeenten?

2. Syntaxis en semantiek

TYPO3 redacteuren cursus

Elektronisch factureren

10 Gouden Tips voor Professioneel Relatiebeheer

Hiervoor heeft u toegang nodig met uw persoonlijke account. Vraag uw account aan, aan de hoofd beheerder.

De wet van Ohm. Student booklet

Van lead naar klant. Alles wat u moet weten over leads

BEVEILIGING GROTERE ELEKTROMOTOREN

MAALTIJDBEZORGING CAFETARIA

Nationale DenkTank 2014 De Datalogus

Rapport 360 Graden Voorbeeld Vragenlijst. Ingrid Brons

Waarom dit e-book. De vele mogelijkheden van LinkedIn zal in dit e-book uitgebreid uitgelegd worden. Ik wens je veel leesplezier!

Begrippenlijst Inzicht in de wereld van big data, marketing en analyse

Hoe komen uw medewerkers in beweging?

STAGEDAG SAM DIEPSTRATEN

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

KENMERKEN MODEL BASED TESTING TOOLS

Werken met eenheden. Introductie 275. Leerkern 275

Meer met Minder Dankzij Een Visie op de Elektronische overheid

Vrije Universiteit Brussel Faculteit van de Wetenschappen Vakgroep Informatica. Deel 2a: Ontwerp van register machines

BIG DATA: OPSLAG IN DE CLOUD

Van CaseTalk naar een database in SQLite studio

IN 4 SIMPELE STAPPEN ONLINE SUCCES! The short Guide

Competentieprofiel De heer Simon Software Engineer

Supply Value Survey. Resultaten verslag VOORBEELD. Supply Value Versie 1.0 Maart 2010 Supply Value 2010 Alle rechten voorbehouden

Aandachtspunten bij de transitie naar een Big Data-omgeving

Vrouwen in de Wetenschap 12 januari 2009

Module 1 Programmeren

Sharing is everything

Transcriptie:

VOLAUTOMATISCH TEKSTEN SAMENVATTEN

VAT SAMEN MET DE SUMMARIZER Iedereen is inmiddels bekend met de term Big data de groeiende hoeveelheid door machines gegenereerde informatie uitgedrukt in cijfers en geld. Minder bekend is de term Big Content de groeiende hoeveelheid door de mens gegeneerde informatie. Naar verwachting groeit Big Content vier keer zo snel als Big Data. In veel zakelijke en wetenschappelijke documenten wordt begonnen met een samenvatting. Uit onderzoek blijkt dat de informatie beter en sneller wordt geabsorbeerd als documenten zijn voorzien van een samenvatting. Om ook die documenten en teksten waar een samenvatting ontbreekt efficiënt en effectief te kunnen verwerken biedt CARP de Summarizer. We krijgen steeds meer informatie te verwerken. Steeds meer nieuws, rapporten, en andere documenten die gelezen moeten worden. Via Internet is een enorme hoeveelheid informatie beschikbaar. Zou het dan niet makkelijk zijn als van al die documenten een samenvatting beschikbaar was? De Summarizer maakt volautomatisch samenvattingen van teksten in het Engels en het Nederlands. De lengte van de samenvattingen die gegenereerd worden is volledig instelbaar. Deze kan worden aangegeven in aantal woorden, zinnen of een percentage van de lengte van het origineel. De samenvatting van een tekst van enkele pagina s wordt binnen enkele seconden gegenereerd. De lengte van de samenvatting is vervolgens in een fractie van een seconde aan te passen. Veel sneller én goedkoper dan een handmatig gemaakte samenvatting! De Summarizer biedt de mogelijkheid om onderwerpen uit het origineel te kiezen en een samenvatting over die onderwerpen te maken. Bijvoorbeeld: uit het persbericht van een bedrijf is alleen de informatie over de omzet interessant. Uit een lijst worden onderwerpen als omzetstijging, omzetvolume en omzetcijfers geselecteerd. Vervolgens genereert de Summarizer een samenvatting die alleen de omzet behandelt. Uit tests is gebleken dat de Summarizer daad-werkelijk in staat is de belangrijke informatie-elementen uit een tekst te halen. De samenvattingen van de Summarizer zijn dus te gebruiken als vervanging van het origineel!

HOE WERKT HET De Summarizer gebruikt een domeinonafhankelijke samenvattingstrategie. Eenvoudig gezegd is deze op te delen in een aantal stappen. Stap 1: het originele document wordt ontleed. In feite gaat het ontleden net zo in zijn werk als op de basisschool wordt gedaan. Van elke zin wordt het onderwerp, persoonvorm, gezegde en dergelijke bepaald. Zo wordt een syntactische structuur van een tekst opgebouwd. Stap 3: uit de betekenisstructuur worden de onbelangrijke delen weggesnoeid. Op een semantische structuur kunnen allerlei wiskundige operaties worden toegepast. Dan wordt dus niet meer met getallen gerekend, maar met de betekenis van de tekst! Stap 4: de gesnoeide betekenisstructuur wordt gebruikt om een nieuwe tekst te genereren. Stap 2: de syntactische structuur uit de vorige stap wordt gebruikt om een structuur van de betekenis van de tekst te maken. Deze bestaat in feite uit concepten en de relaties daartussen. Hieronder staat ter illustratie een zeer eenvoudige betekenisstructuur.

TAALTECHNOLOGIE De Summarizer is beschikbaar als webapplicatie en als webservice zodat deze volledig geintegreerd kan worden in uw bedrijfsproces. Neem gerust contact op als u meer wilt weten over de Summarizer of over onze andere producten: Keyword Extractor: volautomatisch keyword extracitie. Anonimizer: het anonimiseren of pseudonimiseren van teksten. Classifier: het classificeren van teksten op basis van training. Duplicate finder: het vinden van gelijkwaardige teksten mogelijk OVER CARP TECHNOLOGIES CARP is een Nederlandse leider in natuurlijke en computationele taaltechnologie. CARP werd in 1995 opgericht door promovendi van de Universiteit Twente. Het doel van CARP is om individuen en bedrijven te helpen bij het omgaan efficiënt en effectief met een steeds groeiende stroom van ongestructureerde tekstuele gegevens in het algemeen en de communicatie te verbeteren tussen mens en machine in het bijzonder. Copyright 2014 CARP Technologies B.V.

Copyright 2014 CARP Technologies B.V. Tm7-Carp Technologies Munsterstraat 9 7418 EV Deventer Tel. 085 210 1025 Email: info@tm7.nl Web: http://www.tm7.nl/