Workshop OpenRefine – běžte na něj!

Včera jsem si užil nejlepší workshop za hodně dlouhou dobu. Filip Podstavec a Adam Ježek totiž připravili celodenní informační nášup na téma OpenRefine.

Tahání, čištění a transformace dat, to je hlavní zaměření nástroje OpenRefine, jak nám Filip demonstroval na roztomilé úvodní koláži. Data si můžete představit jakákoliv, pokud jsou v textové podobě, využití má totiž nástroj nejenom pro SEO, ale i v PPC, analytice nebo žurnalistice či tvorbě obsahu. Nástroj je zdarma a lze jej doplnit moduly a rozšířeními. Pokud nerozumíte anglicky, máte smůlu, lokalizace neexistuje.

Využití Open Refine najde v případě, že máte:

  • větší set dat
  • znečištěná data
  • zájem o stažení dat například z online zdrojů (např. sitemapy webů)

Filip se na tomto workshopu zaměřil hlavně na to SEO a PPC, protože taková byla sestava účastníků, která byla mimochodem fantastická, většinou jsme se znali, díky čemuž byla atmosféra skvělá a zažili jsme spoustu humorných okamžiků, z nichž vypíchnu unikátní systém hlášení dokončených činností za pomoci tleskání, Filipovo představení kolegyně pečující o naše zásobování pokrmy slovy „to je naše bufetačka“ či prezentační slajdy na míru, kde jsme se podívali na Lukáše Pítru nahoře bez:)

Účastníci školení OpenRefine.
Spokojení účastníci školení OpenRefine.

Na úvod nám byl představen celý princip fungování, jednotlivé funkce, možnosti a příslušnou terminologii, což nám zabralo celé dopoledne, část po obědě pak byla vyplněna praktickými ukázkami a zakončena vzrušující soutěží týmů, která skončila totální remízou.

V čem vidím hlavní důvody, proč byste se měli naučit pracovat s OpenRefine?

  • úspora času – ta bude v některých činnostech obrovská
  • nové inspirace na základě dat
  • šance na lepší přehled o konkurenci
  • šance na přístup k datům, která jinak získáte obtížně

Celkově mám z workshopu více než 5000 znaků poznámek doplněných o 13 screenshotů, abych to vše udržel v hlavě. Pro snazší používání mě v průběhu workshopu napadlo ještě pár doplňkových triků:

  • průběžné rozšiřování vlastní databáze regulárních výrazů pro opakující se segmenty (lokality, brandy, ceny)
  • vložení nejčastěji používaných příkazů GREL jazyka do rozšíření Insert Text, aby je nemusel pořád psát
  • pravidelné ukládání skriptů z hotových výstupů a jejich archivace v cloudu

Jak jsem napsal hned do titulku, je to bomba, jak nástroj, tak workshop. Investice do OpenRefine workshopu se vám prakticky hned vrátí.  Pokud byste měli pochybnosti, mrkněte i na recenzi téhož workshopu od Lukáše Pítry. Podpořit vaše rozhodnutí může i tweet Petry Větrovské.

Zdeněk Dvořák
Na webu publikuje od roku 2001. Postupně se dobral až k linkbuildingu. Jinak také DJ, tatínek a slábnoucí rýpal. Sledujte mě i na Google+ nebo Twitteru.

Komentujte

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *