Wat gaan we doen, vandaag? College 1, 31 oktober 2006
Wat gaan we doen, vandaag? College 1. Inleiding Informatiekunde 1 Inleidende opmerkingen 2 3 4 5
1.1 Algemeen Inleidende opmerkingen Docent: Spreekuur: woensdag 13.00u 14.00u kamer H11.435 Literatuur: J. Glenn Brookshear, Computer Science: An Overview, Reading, Mass., Addison-Wesley. John Nerbonne, Electronische Incunabelen, oratie, RUG, 1995. Website: http://odur.let.rug.nl/ mineur/onderwijs/ Inl-IK.html
1.2 Vereisten Inleidende opmerkingen Belangstelling voor computers Belangstelling voor letteren talen en taalkunde; (computer)communicatie; en/of geschiedenis inclusief kunstgeschiedenis, literatuur Academische vaardigheden (lezen, schrijven, redeneren) Niet vereist: Wiskundig wizkid Vaardigheid met software dat leer je hier
1.3 Cursusdoelen De nadruk in deze cursus zal liggen op de studie Informatiekunde (IK) computergebruik in de letterenvakken het studieprogramma in Groningen het ontwikkelen van academische vaardigheden (schrijven)
1.4 Wetenschappelijke doelen Wetenschappelijke kennis Theorie Samenhangende, algemene verklaring Experiment Concrete, specifieke test van de theorie Toepassing Praktische toepassing van de kennis Tekststructuur Theorie Reeksen, reguliere talen, finite-state automaten Experiment Teksten analyseren in woordvormen (lemma s),... Toepassing Zoeken in tekst-bestanden (WWW)
1.5 Formele vereisten Wekelijks college / discussie (deelname is verplicht) Vijf oefeningen gebaseerd op computerpractica Eén eindpaper (10 pagina s, circa 5.000 woorden) Becijfering Colleges (10%) deelname aan minstens 5 colleges. Oefeningen (50%) elk paper draagt voor 10% bij. Paper (40%)
1.6 Inhoud colleges 31 oktober Inleiding cursus 7 november Rondleiding Letterenbibliotheek 14 november Databases 21 november Communicatie in digitale media 28 november Information retrieval 5 december Strings 12 december Algoritmiek
2.1 Uit de studiegids Informatiekunde onderzoekt de communicatie- en informatieprocessen bij organisaties en individuen, en de rol die informatie- en communicatietechnologie (ICT) daarin speelt. (Studiegids 2006 2007, pag. 54)
2.2 Algemeen beeld: computer als rekenmachine Historisch begrijpelijk, maar niet correct Belangrijkste toepassing tegenwoordig: 1 tekstverwerking 2 data-opslag en -bewerking 3 wiskundige berekeningen
2.3 Waarom computers bij Letteren Veel letterenonderwerpen zijn empirisch en data-intensief. Empirisch: betrekking hebbend op concrete feiten, niet alleen conceptueel Data-intensief: kwesties waarvoor grote hoeveelheden data relevant kunnen zijn
2.3 Waarom computers bij Letteren (vervolg) Voorbeelden van empirische, data-intensieve onderwerpen: Uitspraak van alle Nederlandse woorden 18e-eeuwse Amsterdamse handelsregisters 800 jaar Groningse stadsstructuur Vocabulaire in de geschriften van Shakespeare Voor al die onderwerpen kan de computer uitstekend dienst doen.
2.4 Informatiesystemen Wat doen informatiekundigen met informatie? Verwerven Het digitaliseren van geluid, beeld en video Basale interpretatie, bijvoorbeeld door optical character recognition (OCR) Opslaan Inclusief indexering, en voorbereiding voor het bevragen Organiseren Inclusief databases, en database-uitbreidingen Verwerken Algoritmes en programmeren Presenteren Informatie toegankelijk maken Al deze bewerkingen worden in deze cursus geïllustreerd met onderwerpen uit de alfa-informatica.
2.5 Computergebruik bij letteren Algemeen: tekstverwerker bibliotheekcatalogus / e-library geordende gegevens Historische wetenschappen: data archiveren data presenteren data consistent houden
2.5 Computergebruik bij letteren (vervolg) Literatuurwetenschap: tekstvarianten vergelijken schrift standaardiseren teksten relateren met woordenboeken Taalkunde op grote schaal zinnen ontleden statistische frequenties van woordcombinaties bepalen natuurlijke taal genereren
2.6 Informatiekunde in Groningen Informatiekunde in Groningen is opgezet om computationele ontwikkelingen in de letteren bij te houden de toepassingen te promoten ze verder te ontwikkelen
2.6 Informatiekunde in Groningen (vervolg) Inmiddels is Informatiekunde niet langer uitsluitend een hulpwetenschap, ten dienste van bestaande wetenschappen, maar een zelfstandige, volwaardige wetenschap. Nadruk op talige en historische aspecten Behalve onderzoeks- ook toepassingsgericht
2.7 Lopende projecten bij Informatiekunde Alpino Algorithms for Linguistic Processing. Automatische ontleder. Corea Verwijzing binnen teksten. Grammatica, betekenis, tekstverbanden, tekstcorpora IMIX Question Answering met statistische technieken. IRME Meer-woord lexemen. Handelsgeschiedenis van Nederland Digitaliseren van oude handelsregisters om rijkdom en levensbehoeften in kaart te brengen Paper and virtual cities Virtuele stedelijke cartografie Dialectrometry Determinanten van dialectvariatie. Glosser Simulatie van taalleren
2.8 Curriculum Informatiekunde semester 1. Algoritmiek, Inleiding logica, Webtechnologie I,, Tekstmanipulatie semester 2. Statistiek I, I, Datastructuren, Statistiek II, Webtechnologie II, Corpustaalkunde semester 3. Databases en SQL, Webdesign en XML, Logisch Programmeren, vrije ruimte semester 4. Natuurlijke Taalverwerking I en II, Beeldverwerking, Digitaal geluid, vrije ruimte semester 5. Information Retrieval, Informatiesystemen, keuzevak: Kunstmatige intelligentie of Communicatie en Informatiewetenschappen (CIW), vrije ruimte semester 6. Capita Selecta Electronische Media of Natuurlijke Taalverwerking, vrije ruimte, scriptie
2.9 Verwante vervolgopleidingen Eenjarige masters Informatiekunde Communicatie- en Informatiewetenschappen (CIW) Tweejarige researchmasters Linguistics (Letteren) Computational Modeling of Cognition (BCN) Mens-Machinecommunicatie (MMC)
Eindopdracht: wetenschappelijk betoog Schrijf een wetenschappelijk betoog naar aanleiding van het AWT-rapport van Wiebe Bijker en Ben Peperkamp. Lees ook de begeleidende brief en de uitgebreide toelichting. Vergelijk het perspectief van dat rapport met de insteek die Informatiekunde in Groningen kiest. Vereisten: 10 pagina s, circa 4.000 woorden gestructureerde opbouw, wetenschappelijke stijl in LaTeX, met bibliografische verwijzingen
Inleidende opmerkingen Woensdag van 16.00u tot 18.00u, zaal H.12.102 C 5 papers van 500 1000 woorden In LaTeX (inclusief BibTeX, voetnoten, tabellen, figuren) PDF genereren, URL mailen Indienen vóór maandag 8.00u Let op: Opgaven die te laat zijn ingeleverd, tellen maar voor de helft mee, opgaven die meer dan een week te laat zijn ingeleverd, tellen niet mee.
Morgen Inleidende opmerkingen Voorbereiding: Lees de opdracht op http://odur.let.rug.nl/ mineur/onderwijs/inl-ik-opdr1.html Bekijk de LaTeX-instructies waarnaar gelinkt wordt Lees Electronische Incunabelen van John Nerbonne Denk na over ontwikkelingen sindsdien Uitvoering: Schrijf in LaTeX een betoog van circa 500 woorden waarin je ingaat op de stelling die gegeven is op de website.
Samenvattend Inleidende opmerkingen Wat hebben we vandaag gedaan? Overzicht van de cursus Overzicht van de studie Overzicht van de practica Vooruitblik op de eindopdracht
Volgende week Inleidende opmerkingen Datum: dinsdag 7 november Docent: Dr. Rienk Withaar Locatie: Letterenbibliotheek Rienk Withaar geeft een rondleiding door de bibliotheek. De rondleiding leert studievaardigheden, en is óók interessant vanuit wetenschappelijk perspectief. Ook dit college is verplicht. We verzamelen om 13.15u voor de balie bij de ingang van de Letterenbibliotheek.