Tekstmanipulatie Week 1 Gosse Bouma g.bouma@rug.nl Informatiekunde Rijksuniversiteit Groningen 2007/2008 Gosse Bouma 1/21
Overzicht 1 Inleiding 2 Linux voor Windows-gebruikers 3 Shell & Filesysteem 4 Tot Slot Gosse Bouma 2/21
Doel van de cursus Tekstmanipulatie: tekst automatisch bewerken en onderzoeken Bewerken Converteren naar lower/upper case 1 woord, zin per regel ASCII omzetten in UTF-8 Alle persoonsnamen, geografische namen uit een tekst halen Onderzoek woorden, woordgroepen en zinnen sorteren, tellen gemiddelde woordlengte, zinslengte berekenen Welke woorden in de tekst staan wel/niet in een woordenlijst? Toepassingen Informatie Extractie: afkortingen en hun betekenis zoeken, geboortedata zoeken in 4 jaargangen krantentekst Tweetalig woordenboek maken mbv Wikipedia Gosse Bouma 3/21
Doel van de cursus Waarom Linux? Handig programmeerplatform stabiel, multi-user, multi-tasking Ideaal voor werken met (grote hoeveelheden) tekst veel tools standaard beschikbaar, combineren is gemakkelijk Eindeloze hoeveelheid (gratis) software beschikbaar open source, gratis Wordt gebruikt in practica Gosse Bouma 4/21
Overzicht van de cursus 1 Inleiding Linux Waarom Linux, Linux voor Windowsgebruikers, Filesysteem 2 Inleiding Linux II editors permissies, variabelen, bashrc, ssh 3 Tekstmanipulatie Zoeken en vervangen in tekst, woorden tellen Reguliere Expressies 4 Tekstmanipulatie II Meer woorden tellen, Woordenboeken maken Pipes (Linux als Lego) Gosse Bouma 5/21
Overzicht van de cursus 5 Tekstmanipulatie III Tekst downloaden Automatiseren van handelingen Scripts, Make 6 tot slot Linux voor thuis, Eindopdracht Gosse Bouma 6/21
Toetsing Wekelijkse opdrachten (40%) Eindopdracht (20%) Schriftelijk tentamen (40%) Gosse Bouma 7/21
Linux voor Windows-gebruikers Linux als Windows Linux (KDE) Kmenu Konqueror Firefox, Konqueror Kate, Kwrite, vi, emacs Open Office Acroread Thunderbird Windows Start Menu Windows Explorer Internet Explorer wordpad MS Office Acroread Outlook, Thunderbird Gosse Bouma 8/21
Konqueror Gosse Bouma 9/21
Kate Gosse Bouma 10/21
Shell/terminal Shell van besturingsysteem (Wikipedia) Een shell is een computerprogramma waarmee een gebruiker commando s kan geven aan zijn computer. De shell is een stuk software dat invoer van de gebruiker verwerkt en uitvoer terug geeft. Gosse Bouma 11/21
Terminal Gosse Bouma 12/21
Filesysteem Gosse Bouma 13/21
Nuttige commando s ls mkdir Opdracht1 cd Opdracht1 cd.. pwd list de inhoud van je huidige directory make directory Opdracht1 change directory naar Opdracht1 Ga naar het bovenliggende directory geef de naam van de present working directory Gosse Bouma 14/21
Navigatie Het argument van ls en cd is een pad Directory/Subdirectory/File ls Opdracht1 Subdirectory Opdracht1 ls.. bovenliggende directory ls Opdracht1/Verslag Subdir Verslag binnen subdir Opdracht1 ls../opdracht2 naastliggende directory ls ~ Je home directory ls ~gosse Home directory van gebruiker gosse ls / Het allerhoogste directory ls /bin Subdir van het hoogste directory ls Opdracht1/*.txt alle bestanden die eindigen op.txt Gosse Bouma 15/21
Informatie over bestanden ls -l Listing met details ls -a List ook verborgen files Gosse Bouma 16/21
Files cp ~/gosse/tm/week1/opdracht.txt opdracht.txt copy een bestand cat opdracht.txt schrijft inhoud van bestand naar het scherm less opdracht.txt schrijft inhoud van bestand naar het scherm kate opdracht.txt open een bestand met de editor kate mv opdracht.txt nieuw.txt move bestand naar nieuw bestand rm nieuw.txt remove bestand rmdir Opdracht1 remove (empty) directory rm -r Opdracht1 remove recursively directory Opdracht1 Gosse Bouma 17/21
Meer informatie less hoe kun je scrollen? Kun je naar het eind/begin van een file? Kun je zoeken naar tekst? Man pages man less Geeft alle informatie over bediening van less, Geeft alle opties bij less Gosse Bouma 18/21
Meer informatie less hoe kun je scrollen? Kun je naar het eind/begin van een file? Kun je zoeken naar tekst? Man pages man less Geeft alle informatie over bediening van less, Geeft alle opties bij less Gosse Bouma 18/21
Commando s vinden en hergebruiken TAB doet command & filename completion thunder[tab] wordt aangevuld tot thunderbird ls Tekstman[TAB] wordt aangevuld tot ls Tekstmanipulatie Bij meerdere opties geeft het systeem alle mogelijke completions CTRL-R, geeft het vorige commando Command-lines kun je editen Backspace wist tekens, Invoegen door te typen Gebruik, om de cursor binnen een command-line te verplaatsen, Gosse Bouma 19/21
Gebruik van de shell Knippen en Plakken: Selecteer tekst met de linker muisknop Plak tekst met de middelste muisknop CTRL-C : stop dit proces (commando) Gosse Bouma 20/21
Meer informatie Zie Nestor tekstmanipulatie rightarrow Literatuur & Links Literatuur voor deze week: Linux Tutorial, lesson 1 & 2 Linux cursus, pg 22-40 (linux commandos, les 1 (start) & 2 (filesysteem) Gosse Bouma 21/21