Primo risultato dai dati per la tesi

Ho scaricato 1000 profili di del.icio.us ed ho fatto una prima statistica:

* Media post per utente 412 (0, 947, 14790)
* Media tag per utente 201 (0, 471, 7884)
* Media tag per post 3 (0, 3, 120)

Tra parentesi minimo, deviazione standard, massimo.

Ebbene si, esistono persone che hanno quasi 15.000 post, esistono persone che hanno messo 120 tag ad un singolo post, e persone che usano quasi 8.000 tag…

Il mondo è bello perché è vario!

Secondo i Terms of Service di del.icio.us pare si possa fare di tutto, forché fare una copia del loro sito usando i loro dati!

You may not use these or any other features or the Site itself to allow the display of a substantial portion of the del.icio.us database or reproduce, duplicate or copy the del.icio.us Site.

In un’altra parte, specifica per l’uso delle API, del.icio.us suggerisce di:

  • Please wait AT LEAST ONE SECOND between queries, or you are likely to get automatically throttled. If you are releasing a library to access the API, you MUST do this.
  • Please watch for 503 errors and back-off appropriately. It means that you have been throttled.
  • Please let us know (support@del.icio.us) if you are going to release software that uses this publicly, so that we can at least have a heads-up and hopefully test things out beforehand.
  • Please set your User-Agent to something identifiable. The default identifiers like “Java/1.4.3″ or “lwp-perl” etc tend to get banned from time to time.
  • If you are releasing code for other people to use, your application MUST NOT add any links without a user’s explicit direction. Likewise, you MUST NOT modify any urls except under the user’s explicit direction.

Nel rispetto di questi “suggerimenti” nel mio scaricatore in python mi sono identificato come “Student Project bla bla bla” e ho limitato la frequenza di download ad 1 pagina ogni 30-60 secondi.

*Update:*

A quota 1227 utenti le statistiche si presentano con:

* Media post per utente 408 [min=0, d=919, max=14790]
* Media tag per utente 198 [min=0, d=462, max=7884]
* Media tag per post 2 [min=0, d=3, max=166]

Notiamo che la deviazione standard è leggermente diminuita al crescere del campione, vedrò come questa è legata alla consistenza del campione per avere indicazioni sul numero ottimale di utenti da studiare.

*Update 23-feb:*

A quota 1674 utenti:

* Media post per utente 454 [min=0, d=963, max=14925]
* Media tag per utente 220 [min=0, d=479, max=7884]
* Media tag per post 2 [min=0, d=2, max=166]

*Update 26-feb*

Quota 2003 utenti:

* Media post per utente 466 [min=0, d=1072, max=23262]
* Media tag per utente 217 [min=0, d=463, max=7884]
* Media tag per post 2 [min=0, d=2, max=166]

Posted in Tesi | Comments Off

La famiglia Spera

Una famiglia di oggi, tragicamente esilarante affresco di una realtà tutta italiana: Famiglia Spera

D’altra parte, in un sito che ha dell’incredibile, una perla, quasi degna del divin poeta:

Breve Ode ad un Eroe
(di autore anonimo)

A PiazzaNavona
L’ultimo dell’anno
Scattavi le foto
Ma giunse il Tiranno

Vedevi arrivare
“Il nuovo che avanza”
Tu eri già lì
Muratore in vacanza

E mentre sfilava
Il re del buonsenso
Per farsi ammirare,
Raccoglier consenso

Scagliasti il sostegno
Fu questo il tuo voto
Cogliesti l’indegno
E perdesti una foto

Fortuna non seppe
Ben coglier bersaglio
Un solo ematoma,
Non fu tuo lo sbaglio.

O eroe muratore,
Da Mantova sceso
Vendicatore
Del popolo offeso

Per codesto coraggio
Che invero t’invidio
Rischiavi almeno
Il tentato omicidio

Eroe di noi tutti,
Non c’era mercede
E ciò nonostante
Scagliasti il treppiede

Quel braccio tuo forte
Del David la fionda
Risolleva la sorte
D’un paese che affonda.

Da un commento al suddetto sito.

Posted in Politica, Ridere | Comments Off

La morale vera

Vi racconto una storiella:

C’era una volta un omino, che gli piacevano i bambini. “Che schifo!“, direte! Poi magari riflettendoci, penserete (senza dirlo per non sembrare anche voi dei pervertiti) “Va beh, fin che gli piacciono e non fa nulla di male, passi…“.

Un giorno però arrivarono i computer, e poi i film fatti al computer, prima “Toy Story”, con quei personaggi brutti e finti, ma dopo qualcha anno ecco “Polar Express”, con dei personaggi finti che sembrano quasi veri.

E che cavolo c’entra?

Allora, se il nostro omino è un criminale, che compra immagini di bambini veri (finanziando un mercato orrendo di torture), allora è uno stronzo e merita di essere punito.

Se invece il nostro omino è pedofilo come io potrei essere un filatelico?

Come io non ammazzo il padrone di un francobollo raro per averlo, mi aspetto che lui si moderi e non faccia nulla di male per soddisfare i suoi bisogni.

Questo omino potrebbe aver trovato il modo di procurarsi immagini fatte a computer, virtuali, immagini dove nessun bambino è stato coinvolto.

Questo omino avrebbe trovato il modo, avrebbe immagini eccitanti senza nuocere ad anima viva.

Sento già un coro di bigotti: “Ahh, che dici! È contro natura! Non si fa nemmeno per finta!!“, e il governo sembra dare ragione ai bigotti: Cassandra Crossing/ L’orco elettronico.

Ma siete sicuri che la repressioni delle manifestazioni “innoque” non sia un errore? Magari alcuni, sì, reprimeranno la loro indole, ma gli altri? Non avranno altra alternativa che il mercato illegale “classico”, quello delle immagini VERE!

E solo PER COLPA VOSTRA BAMBINI VERI VERRANNO USATI AL POSTO DI MARIONETTE!!

Grazie ai promotori della legge (i soliti noti…) le “marionette” saranno illegali, ed avremo nuove sofferenze in cambio di una lotta alle intenzioni!

Grazie!

Grazie per avermi ricordato come può essere meschino un politico che teme per la sua poltrona! Grazie per ricordarmi ogni giorno cosa non fare!

Posted in Politica | Comments Off

404 intelligenti con wordpress

Oggi mi sono stufato della pagina 404 di wordpress, e allora ho cominciato a indagare un po’ su come sostituirla con qualcosa di più intelligente.

Ho preso spunto da 404 Search function for WordPress per fare in modo che al posto della pagina di errore venga proposta una pagina di ricerca “adatta” all’indirizzo non trovato.

Ho modificato l’inclusione con "print_r" della pagina, perché l’indirizzo nel browser non è allineato con ciò che si vede nella pagina, inoltre ho aggiunto un po’ di “furbizia” alla ricerca, sostituendo “/” e “-” con degli spazi prima di cercare.

Più o meno la soluzione funziona, qua a seguire il codice: Continue reading

Posted in php, WordPress | Comments Off

La vecchietta s’assopisce…

… ma poi si sveglia e… ve lo dovete guardare! Continue reading

Posted in Ridere | Comments Off