Inicio | DOAC | BigPress | Weblog | Acerca de | Login

Archive for the ‘galicia’ Category

Mapa da blogosfera galega

Monday, June 26th, 2006

Acabo de atopar outro traballo moi interesante, esta vez por Lantania, que fixo un estupendo traballo localizando no mapa moitos dos 1270 blogs galegos. Coma comenta no seu blog podemos observar que se concentran na sua maior parte nos grandes nucleos de poboacion pois mentres outros falan de velocidades de conexion de vertigo en Galicia ainda temos problemas para ver unha paxina decentemente. Tamen se nos fixamos moitos vexo confirmada unha tendencia que tenho observado en G3. Comentanse lixeiramente mais os temas relacionados con Vigo en comparacion cos de A Corunha pese a ter unha poboacion moi similar e evidentemente moito mais que os de Santiago. Isto pode seguramente tera unha relacion co que observamos neste mapa.

Esperemos que estos datos crezan abundatemente nos proximos meses. Comparados cos datos a nivel estatal corresponderianos o menos 5000 blogs, mentres a realidade afastase destas cifras -o menos en canto o que a blogs en galego se refire- polo cal ainda queda moito percorrido posible. Coma xa dixen anteriormente o que a Internet Galega precisa e ser accesible e conhecida, tanto polos que ata o de agora non cairon na importancia que esta acadando coma por aqueles que os que a Internet ainda lles queda un pouco lonxana. Imos achegandos.

Envíalo a menéame

G3 vs. Paxinas.Com

Monday, May 1st, 2006

G3A empresa 3.14 Financial esta a preparar, como moitos de vos saberedes, o lanzamento dun novo buscador en galego que chamarase Paxinas.Com. Moitos foron xa os visitados polo Paxinasbot, basado na araña de codigo aberto Larbin, eu sigo esperando coma mozo namorado a sua visita. Espero que acoda pronto, e estame ben empregado por tanto falar inglés.
Nembargantes este non é nin o primeiro nin o único buscador galego na rede. Sempre foron famosos os directorios -que ninguén os confunda cun buscador a pesares da semellanza- Vieiros ou Galicia City. Logo viron os intentos quizais demasiado tempranos, debido ó atraso tecnolóxico de Galicia, Enxebre e U-lo.

Cando Paxinas.Com comece a funcionar non será o primeiro, pero tampouco o único, pois dende hai preto dun ano está activo G3: O pequeno buscador. Pequeniño pero moi xeitoso conta dende hoxe con novas funcións, mostrando o que se está a falar nos xornais e na blogosfera galegofalante. Tamén xa está disponible a extensión de G3 para o cadro de busca de Firefox.

Tamén nos últimos meses incorporouse a versión en galego de Seekport. Galicia comeza a descobrer Internet o cal da pe unha ampla gama de propostas: Blog Galego, Chuza!, etc.

Envíalo a menéame

A inaccesibilidade das páxinas en galego

Wednesday, February 8th, 2006

Unha das cousas que falta en Galicia son os buscadores de paxinas en galego. Penso que, aparte de todo interes nacionalista/patriotico/galeguista que poida ter este feito, esta a provocar unha inaccesibilidade destas paxinas, que perden lectores con respecto a outras en castelan. A consecuencia final de todo isto e que ninguen publica en galego na internet xa que de seguro vana ter menos ligazons. Se nos fixamos no buscador Google.es, este non conta cunha funcion para buscar paxinas cuio contido este en lingua galega, o contrario que ocorre co castelan, euskera, e catalan. Alguen sabe porque?

Eu tenho unha sospeita. Existen varias formas de detectar en que lingua esta un texto. Moi eficaces sobre todo as basadas en redes neuronais. Pero cando o que estas clasificando son millons de paxinas, unha rede neuronal resulta demasiado custosa en canto a termos de rendemento, asi que o que fan alguns programas aranha coma Nutch, programa araña de codigo aberto que forma parte do proxeto Lucene de Apache, e facer unha busqueda basada en modelos N-Gram que se obtenhen das frecuencias de aparicion de grupos de n caracteres seguidos (xeralmente 1, 2 e 3 caracteres, por ex. “vac”). Para saber en que lingua esta un texto se compara o modelo resultante do texto en cuestion cos de todalas linguas (xeralmente se comparan os 300 primeiros n-gram) e se calcula a distancia entre a posicion dun elemento nunha e outra lista ou ben a diferencia entre a frecuencia. O texto categorizarase como pertencente a lingua cuias sumas de distancias sexan menores.

Tamen pode chegarse a conclusion de que pode pertencer a duas linguas con probabilidades semellantes. Como e normal o caracter mais comun sempre e o espazo (_), pero ainda asi resulta moi util xa que linguas como o aleman tenhen palabras moi longas o cal fai diminuir sustancialmente a frecuencia de aparicion. O feito de que so se comproben as trescentas primeiras cadeas debese a que por experiencia sabese que a partires de enton o modelo volvese moi dependente do tema que trate o texto, sendo tamen moi util este sistema para clasificar artigos por temas.

A que ven todo isto? Resulta que existen modelos n-gram publicamente disponibles para 52 linguas, entre as que se atopan o euskera e o catalan pero non o galego. Seguramente estas son as que emprega Google na sua deteccion da linguaxe e por iso a maioria dos textos en galego figuran como textos en castelan. Para os que pensen que Google detecta moi mal o idioma dicirvos que estos modelos se estiman que acertan nun 89% das veces. Espero que isto sirva de resumo para os non introducidos, non sei se isto dase en algunha asignatura da facultade. Como curiosidade dicir que este sistema empregouse tamen en criptografia. Un dos sistemas de encriptacion mais sinxelos (non moi eficaz por certo) e sustituir cada letra do abecedario por outra o azar. O texto resultante e ilexible a simple vista, pero obtendo un modelo podese saber cales foron as sustitucions feitas basandose na sua frecuencia.

Actualmente estou pensando en facer un modelo para o galego. A gran cuestion e que corpus linguistico empregar para a crear o modelo. Outra cuestion e a diferencia existente entre o galego reintegracionista e o normativo, ata o punto que o abecedario que empregan e distito e quizais fose mellor facer un modelo que soamente cubra o galego normativo Estaria moi complicado distinguir o galego reintegracionista do portugués).

Envíalo a menéame

Feeds galegos para o teu Firefox

Saturday, January 21st, 2006

Xogando con expresións regulares pensei en crear uns feeds RSS para os xornais galegos que extranamente non dispoñen deles. Non podo engadir contido debido a problemas legais pero poden ser moi utiles para usa-los no teu Firefox. Aquí está o resultado:

  • Canal Ciencia: RSS (xa teñen o seu propio)
  • Codigo Cero: RSS
  • Galicia Hoxe: RSS
  • Vieiros: RSS
  • Xunta de Galicia: RSS

Hospitales Privados en Galicia

Monday, August 15th, 2005

La Clinica Fatima de Vigo, uno de los pocos hospitales privados que prestan servicio de la ciudad olivica, era en el pasado una garantia de calidad de servicio para los pacientes, descontentos con el Servicio Galego de Saude (SERGAS).

Si bien esto ha pasado a la historia pues actualmente este centro medico es mas conocido por sus sobornos a los conductores de ambulancias para que lleven a los heridos de accidentres de trafico al centro, lo cual se ha convertido en su principal fuente de ingresos. Desconozco con exactitud las cantidades, quiza alguien pueda informarme mejor, pero este “sobresueldo” ronda los 60 Euros por paciente ingresado, por lo cual el paciente recibe na atencion muy cuidada, hasta casi excesiva.Se comenta que para incrementar la cantidad a percibir del estado las estancias se prolongan mas de lo debido y estos se ven sometidos a mas operaciones de lo recomendable, lo cual deriva en detrimento de su salud.

Envíalo a menéame

El concepto de nacionalidad

Friday, April 15th, 2005

Si nos ceñimos a la practica. La nacion es un espacio de terreno y las personas, lugares y culturas que residen en el. Si tu resides en ese terreno, perteneces a ella. Manuel Fraga promueve en su politica un concepto de nacion ligado a la sangre. Tu nunca seras gallego si no tienes la sangre adecuada. En cambio si tu sangre es buena, seras gallego.

En las proximas elecciones podran votar hasta la cuarta generacion (bisnietos). Independientemente de que hayan estado alguna vez en Galicia o no.

Envíalo a menéame