Manual:Regex/it
From Botwiki
Questo è l'elenco delle regex che ho usato/userò. Non garantisco nulla sull'efficacia di tali regex (controllatele prima di usarle). Cercate di non usare l'opzione all perché l'errore è sempre in agguato ma metterò se è possibile usarlo senza fare errori. Attenzione, se trovate errori o volete una "regex personalizzata", chiedete pure e se volete aggiungere altre regex aggiungete pure qua sotto (mettete la firma e "da controllare" o mettete nella mia pagina di discussione).
Contents |
[edit] replace.py
Il comando replace è analogo al "trova e sostituisci" di windows ma è un po' meno semplice da usare. Questo script inizia dal carattere indicato dopo -start: quindi se siete arrivati alla lettera B, dovete sostituire -start:! a -start:b.
- Regex per sostituire tutti i [[w:Qualcosa|Qualcosa]] con il link appropriato a Wikipedia.
replace.py -regex -start:Pywikipedia:! "\[\[[Ww]:((.*?)|(.*?)[ _](.*?)|(.*?)[ _](.*?)[ _](.*?)|(.*?)[ _](.*?)[ _](.*?))\|(.*?)|\]\]" "[http://it.wikipedia.org/wiki/\1 \2]"
- Questa regex cambia tutti i "Vedi Anche" in "Voci correlate" partendo dal carattere "!", si può usare all
replace.py -start:! -regex "== ?[Vv]edi [Aa]nche ?==" "== Voci correlate =="
- Questa regex cambia tutti i "Link Esterni" in "Collegamenti esterni" partendo dal carattere "!", si può usare all
replace.py -start:! -regex "== ?[Ll]ink [Ee]sterni ?==" "== Collegamenti esterni =="
- Questa regex cambia tutte le E' in È escludendo le E'', le E'S e le E's, partendo dal carattere "!", usate manuale o escludete dalle modifiche la voce Giovanna Marinuzzi (e allora potete usare all).
replace.py -start:! -regex "([^D])E'([^sS'( S)])" "\1È\2"
- Questa regex cambia tutti i "nè" o e apostrofate in "né" (al momento è in prova, non usatela... o usatela in manuale)
replace.py -regex -start:! "\bn(è|e['`´‛’])\b" "né"
- Questa regex cambia tutti i "pò" in po'. (al momento è in prova, i test però hanno dato esiti positivi, quindi usatela in manuale o in all ma con attenzione!
replace.py -regex -start:! "\bpò\b" " po'"
- Questa regex cambia tutti i "perchè" in "perché" così come i poichè, i finchè e gli affinchè (al momento è in prova, non usatela... o usatela in manuale)
replace.py -regex -start:! "\b([Pp]|[Ff]|[Aa])(er|oi|in|ffin)ch(è|[e'])\b" "\1\2ché" -summary:Sostituisco_perchè_&_co._con_perché
- Questa regex cambia tutti le "ÈS" o "Ès" in "E'S" o "E's da usare manuale dato che i risultati saranno pochissimi (mi è servita per rimediare ad un errore, ma sarà utile per altre in futuro.)
replace.py -regex -start:! "\b(È)([Ss])\b" "E'\2"
- Cambia una immagine con un altra (se volete provarlo cambiate immagini però!)
replace.py -regex -filelinks:Bandiera-Olimpica.gif "([Ii]mage|[Ii]mmagine):Bandiera-Olimpica.gif" "Immagine:Olympic flag.svg"
[edit] Usare i dump
replace.py permette di usare i dump di wikipedia scaricabili da http://download.wikipedia.org/ I dump sono delle vere e proprie copie di tutta l'intera enciclopedia che vengono compresse e assemblate in un unico archivio. É estremamente importante utilizzare questa possibilità se si deve fare sostituzioni su tutto il database per vari motivi. Usando l'opzione start si scaricheranno una ad una tutte le pagine dell'enciclopedia che dovranno essere elaborate e verranno inviate decompresse al nostro bot che le controllerà in tutta fretta e nuovamente richiederà altre pagine. Utilizzando l'opzione -xml invece replace.py effettuerà la ricerca prima in locale sul nostro file "di copia" e poi provvederà a scaricare dal server soltanto le pagine che necessitano di essere modificate alleggerendo il carico del server, e gli importanti costi per la connettività, la manutenzione etc. etc. Una volta scaricate solo le pagine selezionate replace.py ricontrollerà nuovamente sulla pagina scaricata se la stessa è già stata sistemata o se ancora necessita modifiche.
I dump dell'enciclopedia vengono eseguiti circa una volta al mese e questo potrebbe rendere il loro uso sconveniente in certi casi (come ad esempio se il dump è molto vecchio). Tuttavia esiste anche il caso del dump appena fatto di 1 o 2 giorni che permette di fare le sostituzioni necessarie controllando l'intera enciclopedia in meno di 20 minuti anziché nell'arco di una settimana.
[edit] Cosa fare passo passo
- Andare su http://download.wikipedia.org/ cercare il link "itwiki" ed entrare nella pagina
- Scaricare il file pages-meta-current.xml.bz2
- Una volta terminato il download decomprimere l'archivio
- Scrivere la normale regex e sostituire il "-start:!" con "-xml:itwiki-XXXXXXXX-pages-meta-current.xml"
- fatto!
Dove ovviamente al posto di XXXXXXX ci sarà la data del vostro dump.
[edit] In fase di Test! Non usare!
- Mega-regex! Cambia: checchè, perchè, affinchè, alcunchè, giacchè, sicchè, finchè, poichè, benchè, acciocchè, fuorchè e macchè. (si deve usare in manuale).
replace.py -regex -start:! "([^Dd]|[^Ee]|[^Hh]|[^Ii]|[^Ll]|[^Nn]|[^Oo]|[^Qq]|[^Tt]|[^Uu]|[^Vv]|[^Ww]|[^Xx]|[^Yy]|[^Jj][^Kk]|[^Zz]|[Pp]|[Ff]|[Aa]||[Cc]|[Gg]|[Ss]|[Bb]|[Mm])(er|oi|in|ffin|hec|lcun|iac|ic|en|ccioc|uor|ac)ch(è|e['])" "\1\2ché"
- Mega-regex 2! Cambia tutti i giorni della settimana con l'accento. (si deve usare in manuale).
- replace.py -regex -start:! " ([^Dd]|[^Ee]|[^Hh]|[^Ii]|[^Nn]|[^Oo]|[^Qq]|[^Tt]|[^Uu]|[^Ww]|[^Xx]|[^Yy]|[^Jj][^Kk]|[^Zz]|[^Pp]|[^Ff]|[^Aa]||[^Cc]|[^Ss]|[^Bb][Gg]|[Ll]|[Mm]|[Vv])(iove|une|arte|ercole|ener)d(i|i['])" "\1\2dì"
- replace.py -regex -start:! "([Ll]une|[Mm]arte|[Mm]ercole|[Gg]iove|[Vv]ener)d(i|i['])" "\1dì"
- Mega-regex 3! stessa funzione della prima (ma questa regex dovrebbe essere più sicura...)
replace.py -regex -start:! "([Cc]hec|[Pp]er|[Aa]ffin|[Aa]lcun|[Gg]iac|[Ss]ic|[Ff]in|[Pp]oi|[Bb]en|[Aa]ccioc|[Ff]uor|[Mm]ac)ch(è|e['])([^'.])" "\1ché\3"
BlogMarks
del.icio.us
digg
Fark
Furl
Newsvine
reddit
Segnalo
Simpy
Slashdot
smarking
Spurl
Wists
