<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Xnoccio.com &#187; Antonio Santos</title>
	<atom:link href="http://www.xnoccio.com/es/author/asantos/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.xnoccio.com</link>
	<description>Blog de viavansi</description>
	<lastBuildDate>Fri, 27 Jan 2012 19:59:52 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>es</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Descarga masiva de subtítulos con Periscope</title>
		<link>http://www.xnoccio.com/es/1081-descarga-masiva-de-subtitulos-con-periscope/</link>
		<comments>http://www.xnoccio.com/es/1081-descarga-masiva-de-subtitulos-con-periscope/#comments</comments>
		<pubDate>Mon, 17 May 2010 12:06:15 +0000</pubDate>
		<dc:creator>Antonio Santos</dc:creator>
				<category><![CDATA[xnoccio]]></category>
		<category><![CDATA[utilidades]]></category>

		<guid isPermaLink="false">http://www.xnoccio.com/?p=1081</guid>
		<description><![CDATA[Voy a compartir con todos vosotros una excelente utilidad que encontré hace unas semanas.
Periscope es una herramienta para la descarga masiva de subtítulos escrita en Python. A partir del código hash del fichero, realiza búsquedas en los portales más importantes para la descarga de subtítulos (﻿OpenSubtitles, SubtitleSource, Subscene, Subtitulos.es) y renombra correctamente los ficheros que [...]]]></description>
			<content:encoded><![CDATA[<p>Voy a compartir con todos vosotros una excelente utilidad que encontré hace unas semanas.</p>
<p><a href="http://code.google.com/p/periscope/">Periscope</a> es una herramienta para la descarga masiva de subtítulos escrita en Python. A partir del código hash del fichero, realiza búsquedas en los portales más importantes para la descarga de subtítulos (﻿OpenSubtitles, SubtitleSource, Subscene, Subtitulos.es) y renombra correctamente los ficheros que se descarga a partir del nombre que tienen los vídeos en la carpeta local, dejándolo todo preparado para que el subtítulo se cargue automáticamente al comenzar el visionado del vídeo.</p>
<p>Soporta múltiples idiomas y dispone de integración con Nautilus, el gestor de archivos de GNOME. Además, se distribuye como librería, así que es posible su integración en otros proyectos. Una maravilla, vamos xD</p>
<p>Yo ya tengo configurado mi sistema para que automáticamente ejecute cada cierto tiempo el siguiente comando:</p>
<p>$ periscope -l es /home/antonio/Incoming/*.avi</p>
]]></content:encoded>
			<wfw:commentRss>http://www.xnoccio.com/es/1081-descarga-masiva-de-subtitulos-con-periscope/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>MiniTip &#8211; Trabajar con archivos odt de OpenOffice en modo texto</title>
		<link>http://www.xnoccio.com/es/532-minitip-trabajar-con-archivos-odt-de-openoffice-en-modo-texto/</link>
		<comments>http://www.xnoccio.com/es/532-minitip-trabajar-con-archivos-odt-de-openoffice-en-modo-texto/#comments</comments>
		<pubDate>Thu, 05 Nov 2009 20:33:33 +0000</pubDate>
		<dc:creator>Antonio Santos</dc:creator>
				<category><![CDATA[xnoccio]]></category>
		<category><![CDATA[linux]]></category>
		<category><![CDATA[openOffice]]></category>
		<category><![CDATA[tips]]></category>

		<guid isPermaLink="false">http://xnoccio.com/532-minitip-trabajar-con-archivos-odt-de-openoffice-en-modo-texto/</guid>
		<description><![CDATA[Hace unos días se planteaba en uno de los equipos de trabajo una duda muy concreta: cómo buscar una cadena de texto en cientos de archivos de OpenOffice de manera eficiente.Un fichero odt no es más que un conjunto de ficheros xml comprimidos en formato zip por lo que, afortunadamente, se pueden utilizar herramientas diseñadas para trabajar [...]]]></description>
			<content:encoded><![CDATA[<p>Hace unos días se planteaba en uno de los equipos de trabajo una duda muy concreta: cómo buscar una cadena de texto en cientos de archivos de <em>OpenOffice</em> de manera eficiente.Un fichero <em>odt</em> no es más que un conjunto de ficheros <em>xml</em> comprimidos en formato <em>zip</em> por lo que, afortunadamente, se pueden utilizar herramientas diseñadas para trabajar con texto plano una vez que se descomprime el fichero binario. Sin embargo, los ficheros <em>xml</em> contenidos no están pensados para ser interpretados por personas, sino por ordenadores, por lo que es necesario un proceso previo del contenido. La utilidad <a href="http://stosberg.net/odt2txt/">odt2txt</a> (disponible en los repositorios de las principales distribuciones) se encarga de ello y, a partir de un fichero que se pasa como parámetro, escribe por la salida estándar sus contenidos, dándoles un formato más amigable. En Ubuntu se puede instalar mediante un simple</p>
<p><code>sudo apt-get install odt2txt</code></p>
<p>Una vez que está instalada, ya se puede integrar en distintos scripts que hagan lo que necesitemos. Por ejemplo, para localizar los ficheros <em>odt</em> que contienen una cadena de texto dentro de una carpeta y sus subdirectorios podemos utilizar el siguiente:</p>
<p><code>#!/bin/sh<br />
for i in `find . -name *.odt`; do<br />
if [ `odt2txt "$i" | grep -iE "$@" | wc -l` -gt 0 ]; then<br />
echo "Texto encontrado en $i"<br />
fi<br />
done<br />
</code></p>
<p>que se utilizaría de la siguiente manera:</p>
<p><code><br />
$ ./find_in_odt.sh "cadena de texto a buscar"<br />
</code></p>
<p>El script anterior cuenta con la limitación de que no está preparado para funcionar con carpetas cuyo nombre contiene espacios. Otra opción podría ser la búsqueda de diferencias entre dos ficheros:</p>
<p><code>#!/bin/sh<br />
odt2txt $1 &gt; tempfile1<br />
odt2txt $2 &gt; tempfile2<br />
diff -u tempfile1 tempfile2<br />
rm tempfile1 tempfile2<br />
</code></p>
<p>ejecutable como (recomiendo instalar <em>colordiff</em> para ser usado en lugar del <em>diff</em> tradicional):</p>
<p><code>$ ./odtdiff.sh fichero1a.odt fichero1b.odt</code></p>
<p>Más aún: podemos integrar <em>odt2txt</em> con sistemas de control de versiones como <a href="http://git-scm.com">Git</a> (usado por el kernel de Linux, Gnome, Android o Ruby on Rails entre otros) para conseguir integración con ficheros de OpenOffice (útil para ver los cambios entre las diferentes versiones en el repositorio). Para ello, basta con añadir al archivo de configuración <em>.gitconfig</em> (presente en el directorio de usuario en Linux y OSX)</p>
<p><code><br />
textconv=odt2txt<br />
</code>y luego, dentro del repositorio del proyecto, crear o modificar el archivo <em>.git/info/attributes</em> para que contenga</p>
<p><code><br />
*.ods diff=odf<br />
*.odt diff=odf<br />
*.odp diff=odf<br />
</code></p>
<p>Espero que alguno de estos consejillos os sirva de utilidad, ¡un saludo!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.xnoccio.com/es/532-minitip-trabajar-con-archivos-odt-de-openoffice-en-modo-texto/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Metadatos</title>
		<link>http://www.xnoccio.com/es/459-metadatos/</link>
		<comments>http://www.xnoccio.com/es/459-metadatos/#comments</comments>
		<pubDate>Fri, 17 Apr 2009 13:47:55 +0000</pubDate>
		<dc:creator>Antonio Santos</dc:creator>
				<category><![CDATA[xnoccio]]></category>
		<category><![CDATA[estándares]]></category>

		<guid isPermaLink="false">http://xnoccio.com/459-metadatos/</guid>
		<description><![CDATA[Siguiendo con el tutorial que queremos realizar acerca de la web semántica, nos parece que uno de los puntos principales va a ser la definición de los conceptos alrededor de los cuales gira la Web Semántica, conceptos que si bien no son nuevos (los hay incluso heredados de la Filosofía), han visto su significado adaptado [...]]]></description>
			<content:encoded><![CDATA[<p>Siguiendo con el tutorial que queremos realizar acerca de la web semántica, nos parece que uno de los puntos principales va a ser la definición de los conceptos alrededor de los cuales gira la Web Semántica, conceptos que si bien no son nuevos (los hay incluso heredados de la Filosofía), han visto su significado adaptado en esta nueva tecnología. A lo largo de estas entradas voy a intentar simplificar todo lo que pueda y a hacer la asunción de que el lector desconoce por completo el tema, así que disculpadme si pensáis que estoy tratando algo básico. Para eso están los comentarios, para que opinéis <img src='http://www.xnoccio.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>El concepto más importante, y a la vez probablemente el más conocido, es el de <em>metadato</em> (<em>metadata</em> en inglés). Los metadatos se definen como &#8220;datos acerca de otros datos&#8221;, lo cual por sí mismo puede resultar una definición pobre. Sin embargo, un ejemplo lo dejará mucho más claro: imaginemos una canción en el ordenador (una canción en formato <em><a href="http://www.vorbis.com">ogg vorbis</a></em> y descargada desde <em><a href="http://www.jamendo.com">Jamendo</a></em>, por supuesto <img src='http://www.xnoccio.com/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /> ). Esta canción es analizada por nuestro reproductor de música preferido que (normalmente) es capaz de mostrar diversa información acerca de ella. Como mínimo, los nombres de la canción, cantante y álbum. Estos tres campos son información (datos) acerca de la canción (otros datos) .</p>
<p>Si os dais cuenta, el mundo está plagado de metadatos: la mayoría de las cámaras digitales &#8220;firma&#8221; las fotografías con, entre otras cosas, la fecha de toma de la instantánea; los ficheros de un sistema operativo derivado de UNIX (como Linux y OS X) tienen metadatos que definen qué usuarios tienen (o no) acceso a ellos; y en aplicaciones web como <em><a href="http://www.flickr.com">Flickr</a></em> las fotografías tienen etiquetas asociadas para facilitar su clasificación.</p>
<p>¿Y cuál es la relación de los metadatos con la web semántica? Son el elemento básico para formarla, pues recordemos que la web semántica pretende hacer posible que los ordenadores <em>entiendan</em> los contenidos de la web. El método exacto para lograrlo lo veremos en posteriores entregas, pero de momento creedme cuando escribo que los metadatos van a ser vitales en el proceso <img src='http://www.xnoccio.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.xnoccio.com/es/459-metadatos/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>La web semántica</title>
		<link>http://www.xnoccio.com/es/448-la-web-semantica/</link>
		<comments>http://www.xnoccio.com/es/448-la-web-semantica/#comments</comments>
		<pubDate>Thu, 02 Apr 2009 08:01:37 +0000</pubDate>
		<dc:creator>Antonio Santos</dc:creator>
				<category><![CDATA[xnoccio]]></category>
		<category><![CDATA[estándares]]></category>

		<guid isPermaLink="false">http://xnoccio.com/448-la-web-semantica/</guid>
		<description><![CDATA[Ayer comenzamos con lo que pretendemos sea una colección de artículos acerca de la web semántica, que iremos desarrollando a lo largo de las siguientes semanas. En la entrega de hoy, daremos una pequeña introducción acerca del tema. Ya que nosotros también estamos aprendiendo en este momento, espero que nos perdonéis y corrijáis posibles errores [...]]]></description>
			<content:encoded><![CDATA[<p align="justify"><em><a href="http://xnoccio.com/444-cool_uris_web_semantica/" title="CoolUris">Ayer</a> comenzamos con lo que pretendemos sea una colección de artículos acerca de la web semántica, que iremos desarrollando a lo largo de las siguientes semanas. En la entrega de hoy, daremos una pequeña introducción acerca del tema. Ya que nosotros también estamos aprendiendo en este momento, espero que nos perdonéis y corrijáis posibles errores <img src='http://www.xnoccio.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </em></p>
<p align="justify">En la actualidad, la web es una colección de datos inmensa, que permite a una persona acceder a una gran cantidad de información y operar sobre ella. Sin embargo, lo que es una virtud se puede entender también como uno de sus grandes defectos, debido a que existe tanta información que cada día resulta más complicado procesarla y hacer consultas sobre ella. Además, la heterogeneidad en las fuentes de información dificulta en gran medida la interoperabilidad entre sistemas.</p>
<p align="justify"> La web semántica es una evolución de la actual tecnología, pensada para proveer de contenido semántico a la web actual. Gracias a este contenido semántico se posibilita que no sólo una persona pueda entender la información que presenta una página web, sino que se habilita a las máquinas a tal efecto. De esta manera, un buscador puede realizar una consulta de una forma más inteligente, procesando los resultados y descartando o seleccionando los que mejor se adaptan a los parámetros de la búsqueda.</p>
<p align="justify"> En el fondo, la web semántica trata de proveer un cierto grado de inteligencia a la web actual. Tim Berners-Lee, el inventor del World Wide Web y uno de los principales valedores de la web semántica, se expresaba así en 1999:</p>
<p align="justify">  <em>I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.</em></p>
<p align="justify">Una traducción un poco libre <img src='http://www.xnoccio.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p align="justify"><em>He tenido una visión para la Web [en la cual los ordenadores] serán capaces de analizar todos los datos de la Web &#8211; los contenidos, enlaces y operaciones entre las personas y las máquinas. Una &#8216;Web Semántica&#8217;, que debería hacer esto posible, todavía tiene que aparecer, pero cuando lo haga, las operaciones diarias de comercio, burocracia, y nuestras vidas serán manejadas por máquinas hablando con otras máquinas. Los &#8216;agentes inteligentes&#8217; que la gente ha esperado por años finalmente se harán realidad.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.xnoccio.com/es/448-la-web-semantica/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

