Taal is van ons allemaal!

Vergelijkbare documenten
Linux en Open Source

UBUNTU. Vandaag had ik voorzien om een opstart-cd of usb te maken om je pc op linux op te starten. Open source. Gratis software UBUNTU

Open Source Software. Bart van Dijk

Organisatie. Gestart in 2009 Open Source Webdevelopment Grafische achtergrond Servicegericht

Hoofdstuk 2 Starten van OpenOffice.org

eid middleware v2.6 voor GNU/Linux

Vrije Software: een overzicht. Paul Cobbaut November 2011

Windows XP Migratie opties. Bart van Dijk

eid middleware v2.6 voor Mac OS X

Handleiding PDF-Xchange Editor met spellingscontrole versie voor Google Chrome

De webpagina kan niet worden weergegeven

Systeemvereisten. Datum: Naam: Systeemvereisten versie 43 revisie 15 Status:

Open Source: Bekend op Curaçao?

Voorwoord. Handleiding voor Math

Ibis systeemvereisten

Stel je een wereld voor waarin elke persoon vrije toegang heeft tot alle kennis. Dat is waar wij aan werken. Jose Spierts april 2010

Linux. Linux lezing 13 april 2005 Marcel Nijenhof Note: De slechste vragen zijn niet gestelde vragen

HCC presentatie: Linux iets voor mij?

Friesland College Leeuwarden

OpenChange. Jelmer Vernooij. LinuxWorld 2009, Utrecht 4 november OpenChange. MAPI MAPI/RPC OpenChange Huidige status Toekomst.

PRESTATIESITE WEBPAKKET

Hoofdstuk 2 Starten van OpenOffice.org

Bestaat GRATIS wel? Gedrevenheid Open Source Donaties Commerciële motieven

Overzicht. Tekstmanipulatie. Doel van de cursus. Doel van de cursus. Tekstmanipulatie: tekst automatisch bewerken en onderzoeken. Waarom Linux?

LINUX ZORIN. een alternatief voor MS Windows

Totaal cm. Aantal vissen

Linux Mint Cinnamon 18.1 Ervaringen. Bart van Dijk

De tekstverwerker als bondgenoot van de vertaler

Microsoft Word Spellingcontrole

Hoofdstuk 12: Spelling en grammatica

Overstappen van Windows naar Linux. Hans Lunsing

Tekstmanipulatie. Week 1. Gosse Bouma 2007/2008. Informatiekunde Rijksuniversiteit Groningen

WEBDESIGN & Joomla 3.6

INHOUDSOPGAVE 2 INSTRUCT

De voordelen van Drupal

Analyse Programmeertalen

iprova Suite Systeemeisen iprova 5 Hosting

Whitepaper linkbuilding Het verbeteren van uw positie in de zoekmachines

LibreOffice de opvolger van OpenOffice.org??

Inhoud Basiscursus. Word 2010 NL-NL

Open Safari op de Mac, ga naar de webpagina en klik op SSH scripts Mac OS X : Figure 1 SSH scripts downloaden

2 Eisenanalyse. 2.1 Functionele eisen het UseCaseDiagram

Werkplekbeheer en kantoorautomatisering Examennummer: Datum: 24 maart 2012 Tijd: 13:00 uur - 14:30 uur

NIEUWE MEDIA TOOLS & SKILLS les 2. FACEBOOK EN JE ORGANISATIE landschap, good practices en uitbouw

Intranet: content-beheersystemen 1

van PSD naar JavaScript

Beknopt: wat is WoDy?

WEBDESIGN. & WORDPRESS 2016 editie PRAKTISCH TOEGEPAST. 2016, Roy Sahupala

GEBRUIKERSHANDLEIDING MAAKJETRAINING.NL 1

Hardware Specialisatie. Module 1: Zoeken op het internet

Documenten scannen met OCR

Gratis software op het Internet. Karel Nijs 2009/03

Kennis maken met Linux. Besturingsystemen: windows, apple/mac, linux/unix

Waarom gebruiken web- ontwikkelaars Wordpress als CMS?

Breekijzer. Een algoritme voor het afbreken van Nederlandse woorden. D.S.P. Mantione. Augustus 2007

Het handboek van KMouth

Debian 8. van inleiding tot systeembeheer

UBUNTU inleiding. Onderwerpen. Inleiding Linux compatibiliteit naar hardware Ubuntu als distro Veiligheid en beheer. 1.

Ibis systeemvereisten

AppWriter Cloud. Handleiding. versie ICT voor beter lezen en leren!

Hoofdstuk 2 Basiskennis Muistechnieken Windows Verkenner

Wat is Linux? Het is een zogenaamde kernel gemaakt door Linus Thorvalds in Bied basis diensten aan programma's.

Tevens zou het niet compleet overbodig zijn om het fenomeen commercieel te bespreken

Als eerste bedankt voor het aanschaffen van deze PDF waarin ik je handige tips en trucs zal geven over het schrijven van een handleiding.

software & security antwoorden

User experience voor projecten

Zakelijk Veiligheidspakket van InterNLnet Handleiding voor de installatie van Windows besturingssystemen.

Luisteren en kijken - Betrouwbaarheid vmbo-kgt34

FAQ t.b.v. Magister & Silverlight

WORDPRESS. De Volgende Stap. 2015, Roy Sahupala

Voorop lopen door vrije data

Van dvd naar webserver. Marcel Nijenhof 18 Juli

Prijslijst Algemeen. Reparaties. Installaties. Voorrijkosten binnen gemeente Bedum: 5,- Voorrijkosten buiten gemeente Bedum: 20,-

Dag van Geogebra 2013

Wij kunnen voor uw bedrijf een vaste IT-partner zijn voor het leveren van de nodige adviesen.

Aan Hoofd ICT Securityofficer. Datum 20 oktober 2011 Betreft Vrijgeven DVS na DigiNotar incident. Geacht heer, mevrouw

Transcriptie:

Taal is van ons allemaal! Bart Knubben bart.knubben opentaal.org www.opentaal.org NOiV-symposium 5 maart 2009

Achtergrond Situatie 2005: Verschillende Nederlandstalige woordenlijsten in open source software Spellinghervorming 2005: nieuw Groen Boekje NTU: Groene boekje niet integraal vrij beschikbaar, wel keurmerk mogelijk Spellingregels verplicht voor onderwijs en overheid per aug. 2006 2

Start OpenTaal 1 november 2005: Fabrice Mous (OSOSS, KDE.nl), Bart Knubben (OSOSS); Simon Brouwer (nl.openoffice.org), Piet van Oostrum (NTG), Hans Hagen (NTG). Doel: Het project OpenTaal maakt vrije Nederlandstalige taalhulpbestanden voor gebruik in opensourceprojecten. 3

Taal als open standaard Uitgangspunt: De Nederlandse taal is dé standaard voor gegevensuitwisseling in Nederland, België en Suriname. Deze standaard zou open moeten zijn. Kortom: Taal is van ons allemaal! 4

Organisatie Wie is OpenTaal? > 50 individuen (vanuit NTG, Gnome, KDE, OOo etc., wetenschap en overig) 5 à 10 echt actievelingen Gebruikte tools: Mailinglist (1165 mails in 2007) Website (www.opentaal.org) WordHarvester Munch/Unmunch, Hunspell, LanguageTool, etc. 5

Licentie Het was LGPL Nu twee licenties (dual license): BSD CC-BY Kortom: Naamsvermelding is voldoende 6

Activiteiten 1. Woordenlijst (voor spellingcontrole) 2. Woordafbreking 3. Grammaticacontrole 4. Synoniemenlijst 7

Werking WordsHarvester harvester OpenTaal Database toegeleverd materiaal >2.5 mln. woorden >30 mln. zinnen Off-line bewerking gebruikersbestanden 8

WordsHarvester 9

Woordenlijst 1.0-versie: 08 juni 2007 Keurmerk van Nederlandse Taalunie > 140.000 woorden Geoogste woorden via WordsHarvester Samenstelling op basis van relatieve woordfrequentie 10

Gebruik woordenlijst OpenOffice.org Mozilla Firefox en Thunderbird Google Chrome KDE, GNOME, (La)TeX, VIM Wikipedia en Wiktionary Hunspell, Aspell, Ispell OpenMoko Distributies: Debian, Mandriva, Ubuntu In zoekmachine als hulpmiddel voor indexering Om woordpuzzels op te lossen Andere mogelijkheden: OCR-tekstscannen? 11

Voorbeelden gebruik (1) OpenOffice.org Mozilla Thunderbird Mozilla Firefox 12

Voorbeelden gebruik (2) Illume virtuele toetsenbord voor Enlightenment O.b.v. statistieken van de karakters met diakritische tekens in de Nederlandse taal 13

Gebruikscijfers Losse module: > 1 miljoen downloads (april 2008) Nu moeilijk te bepalen, omdat woordenlijst is geïntegreerd in software Schatting: > 2 miljoen 14

Woordafbreking Oorspronkelijk afbreekpatronen: NTG Afwijkende afbrekingen: omaatje -> oma=tje, cafeetje -> café=tje, AOW'er -> AOW=er Dubbelzinnig: bal=le=tje/bal=let=je, valk=uil/val=kuil Status: testversie beschikbaar 15

Synoniemen Waarom? Handig voor bijv. tekstverwerker (OOo) en zoekmachine Synoniemen verzamelen met OpenThesaurus Huidige omvang: 11.892 synsets Status: testversie beschikbaar 16

Grammaticacontrole Waarom grammaticacontrole? Detectie van veel voorkomende fouten, zoals:...verkeerd in goede staat..., perse, s' ochtends Definities van regels (ook wel: rules) in XML op basis van LanguageTool Omvang: 250 rules Status: testversie beschikbaar 17

Inhoudelijke ambities 1.0-versies van: woordafbreking, grammaticacontrole en synoniemenlijst Nieuwe versie (1.1) van woordenlijst Witte spelling variant van woordenlijst OpenWoordenboek.nl /.be: vrij online beschikbaar woordenboek... 18

Organisatorische ambities Verbreding en intensivering van samenwerking Met Nederlandse Taalunie Met wetenschap Met Wikipedia Internationaal etc. Oprichten van stichting Uw deelname! 19

Hoe kan ik bijdragen? Profiel van de OpenTaler : geïnteresseerd in taal, programmeur of niet-programmeur, taalkundige of niet... Draag bij via een webapplicatie (beoordelen) Draai WordsHarvester Help mee in een technisch deelproject... PHP, Java, techniek website Help mee de OpenTaal-bestanden in (open source) software te integreren Doneer tekstmateriaal/informatie 20

Taal is van ons allemaal! van: Albert, Arno, Bart, Bauke, Bob, Daniel, Daniël, Dennis, Erik, Floris, Hans, Jan, Johan, Jules, Katrien, Laci, Lies, Marcin, Martin, Michiel, Pander, Piet, René, Rik, Ronald, Ruud, Sander, Simon, Thom, en nog veel meer behulpzamen. En ook van U! 21

Vragen?? Website: http://www.opentaal.org 22