Categories
python software libre visor de imágenes xkcd

Visor de imágenes para xkcd

Una de mis tiras cómicas favoritas es xkcd, y desde ya hace tiempo quería descargarme todas las tiras para tenerlas en el disco duro. Si han leido xkcd seguro sabran de los textos adicionales que Randall Munroe pone en el atributo title de las imágenes, este texto es complementario a la tira y en muchas ocasiones mas gracioso que la tira misma.

Así que si descargaba las tiras tenia que hacerlo con todo y titulo. Tuve un tiempo libre esta navidad y me puse a recolectar información de como hacerlo, lo primero era descargar las imágenes y guardar el texto del tooltip en los metadatos de la imagen, para esto me fue de mucha ayuda este articulo donde se explica como hacerlo usando la libreria PIL.

Lo siguiente era crear un visor de imágenes que mostrara los tooltip, algo complicado y mas teniendo en cuenta que esta es la segunda interfaz gráfica “seria” que hago, pero encontré muy buenos recursos como este libro online sobre tkinter con muy buenos ejemplos, ademas de un script que implementa un tooltip que me cayo de perlas.

Luego de varias horas de pelearme acomodando los widget (con pack y grid), he aquí el visor de imágenes junto con todas las tiras hasta la fecha (1-995).

Si bajan el código fuente necesitaran instalar las siguientes librerías:
  • PIL (en Windows y Linux)
  • ImageTk (solo en Linux: python-imaging-tk)
  • Tkinter (solo en Linux)
Si tienen alguna sugerencia no duden en dejarla en los comentarios, siempre es bueno saber en que mejorar.
Categories
descargas megaupload mget programa script software libre

Actualización mget

Debido al rediseño de megaupload mget ha dejado de funcionar, el problema se debe específicamente a que el link de descarga ya no se identifica con el id downloadlink sino con la clase download_regular_usual, ademas el tiempo de espera ahora es de 60 segundos.

Por el momento no tengo como arreglar la versión para windows pero la de linux ya esta lista, solo hay que reemplazar el archivo antiguo y dar permisos de ejecución.

Categories
descargas megaupload mget python software libre wget

mget ahora para windows

Actualización: se incluyeron las dependencias del wget que faltaban, que pena u_u.

Un amigo me pidió que le pasara el programa con el que descargo de megaupload, pero en cuanto le dije que tenia que:

  1. Descargar e instalar python 2.6.
  2. Descargar e instalar wget para Windows.
  3. Poner los directorios de wget y python en el PATH de Windows.
En seguida se desanimo (no se por que XD), así que me pase toda una tarde mejorando un poco el programa e intentando convertirlo en un ejecutable usando pyinstaller y he aquí el resultado:
Basta con descomprimir los archivos en la carpeta windows y a descargar de megaupload. Lo probé en varias maquinas con Windows XP y funciono correctamente, pero si tienen algún problema no duden en dejarlo en los comentarios.
Su uso es muy sencillo, abren la consola de comandos y:
mget -c url-con-link-de-megaupload

mget -i archivo-con-links

mget link1 link2 link3 ...

Para una próxima explico como fue lo de convertir el script en ejecutable, algo muy util para compartir los programas que hagamos con amigos.

Pueden seguirme en twitter o agregarme en Google+

Categories
bash descargas linux megaupload programación proxy script software libre

script: descarga automática de Megaupload

Aprovechando que estoy aprendiendo a programar en bash y que megaupload ahora no requiere llenar ningún captcha para realizar las descargas, decidí rescribir el anterior script (escrito en python) y agregarle nuevas características.

Ahora es posible indicar una URL (con la opcion -c) y el script extrae los links de Megaupload que encuentre, me parece una funcionalidad muy conveniente ya que con el anterior script era necesario copiar a mano todos los links a un archivo de texto, lo cual puede ser muy tedioso.

Otra funcionalidad es la de usar la dirección ip de los servidores para realizar las descargas, esto ayuda a saltarse algunos proxies que están configurados para bloquear paginas por nombres de dominio en lugar de direcciones ip XD.

El script ha sido probado con Ubuntu 10.10 que es el OS que uso actualmente, pero no creo que tengan problemas usándolo en otra distro, siempre y cuando tenga instalado wget que es el programa que usa para realizar las descargas.

Pueden descargarlo del siguiente enlace:

Luego le damos permisos de ejecución y lo copian en el directorio bin:

novatoz@sney2002:~$ chmod +x mget
novatoz@sney2002:~$ sudo cp mget /bin/

Espero les sea de utilidad, y si tienen alguna inquietud o sugerencia no duden en dejarla en los comentarios.

update: corregido error que impedía descargar archivos cuyos nombres contuvieran  caracteres no ascii, los cuales están codificados usando html entities, ejemplo:

# este link no apunta a ningún archivo
http://www465.megaupload.com/files/f4f4ab2163558f1f/Capacitación.mp4
# el link es valido al cambiar ó por ó
http://www465.megaupload.com/files/f4f4ab2163558f1f/Capacitación.mp4

ahora es necesario tener instalado w3m

Categories
Canvas event html5 javascript jQuery software libre

canvas-event: fácil interacción con el elemento canvas

Uno de los elementos HTML5 que sin duda ofrece mayores posibilidades es el elemento canvas, gracias a este es posible crear y manipular imágenes directamente en el navegador, pero a la hora de crear algo mas que imágenes estáticas  nos tropezamos con la falta de métodos para el manejo de eventos, aun así encontramos aplicaciones web que permiten la interacción por medio del teclado y el ratón.

¿Como logran esta interacción?, si vemos en el código de estas aplicaciones, todas siguen mas o menos el mismo patrón:

  1. Agregar evento mousemove al elemento canvas
  2. comparar coordenadas del cursor con las de Objetos dibujados
  3. Seleccionar objeto sobre el cual se encuentra el cursor
  4. Al ocurrir un evento, ejecutarlo sobre el Objeto seleccionado
  5. Redibujar el canvas
No es algo difícil, pero podría ser mucho mas fácil.

Con esto en mente y luego de robar algunas ideas y algo de código de otros proyectos como procesingjs, jQuery, jquery-hotkeys y canto-js, nació canvas-event, una librería que se encarga del manejo de los eventos, facilitando el desarrollo de aplicaciones interactivas en el elemento canvas; ademas cuenta con objetos predefinidos como círculos, rectángulos, rutas e imágenes entre otros.

Algunos ejemplos de lo que se puede hacer con canvas-event:

Cv = Cevent("id-canvas");

// encadenamiento de métodos
Cv.circle( 40, 40, 40 )
.attr({fill: 'red'})
.rotate( 30 );

// manejo de eventos al estilo jquery
Cv.click( function(e) {
this.fill = this.fill == 'green' ? 'red' : 'green';
});

// eventos del teclado asociados a combinación de teclas
Cv.keydown( 'ctrl+s', function(e){
alert( "el Objeto ha sido guardados");
return false;
});

// Drag and drop
Cv.ellipse( 30, 40, 50, 10 )
.drag({
start: function() { console.log( "drag start" ); },

move: function() { console.log( "move to ", this.x, this.y ); },

end: function() { console.log( "drag end" ); }
})

// identificadores de Objetos
Cv.image(50, 100, "ball.gif").addId("pelota").rect(100, 50, 20).draw();

// Recuperar elementos por su Id o tipo;
Cv.find('#pelota').attr("alpha", .5).redraw();

Cv.find('rect').click(function(){
alert( "Hola, soy un rectangulo" );
});

// Eventos live
Cv.mouseover( "#pelota", function(e){
alert( "Soy una pelota" );
});

// Este Objeto también tendrá el evento anterior
Cv.circle(175, 75, 20).addId('pelota');

Ademas, podemos definir nuestras propias figuras extendiendo el objeto Shape:

var Triangle = Cevent.Shape.extend({
// inicializador
init: function( x, y, size ){
this.size = size || 5;
this._super( x, y );
},

// ctx es el context en el que se debe dibujar
draw: function( ctx ) {

ctx.save();

// aplicamos estilo y trasformaciones
this.applyStyle( ctx );
this.setTransform( ctx );

// definimos el contexto en el cual dibujaremos
// para poder usar todos los métodos svg definidos en Cevent
// como M (move) c (cubicBlazier) etc
Cevent.beginPath( ctx )
.M( this.x, this.y )
.h( 1 * this.size )
.v( 1 * this.size )
.z();

if ( this.fill ) { ctx.fill(); }

if ( this.stroke ) { ctx.stroke(); }

ctx.restore();
}
});

// registramos el nuevo objeto
Cevent.registre( "triangle", Triangle );

// ahora podemos hacer uso del nuevo objeto
var Cv = Cevent( "canvas-id" );

Cv.triangle( 40, 30, 10 )
.attr({
fill: "#050",
alpha: .5
})
.focus(function() {
this.fill = "#999";
})
.blur(function() {
this.fill = "#050";
})
.draw();

Por el momento falta documentación pero se incluyen varios ejemplos de su uso, si tienen alguna duda y/o sugerencia por favor déjenla en los comentarios o en la pagina del proyecto en google code.

Categories
captcha descargas gnu megaupload ocr programación python software libre

Saltándose los captchas de Megaupload con python

Como todo buen gorrón me gusta las cosas gratis y fáciles, sobre todo cuando se tiene una serie de 24 capítulos que se quiere descargar sin estar pendiente rellenando captchas, y aunque las cuentas premiun no son tan caras, la verdad no me apetece gastarme una platica en algo que voy a utilizar muy rara vez, así que hice lo que cualquier persona normal haría, juntar un montón de software libre y pegarlos con un poco de python y voila mi propio gestor de descarga con reconocimiento de captchas (solo megaupload), ya se que hay muchos programas que hacen lo mismo y ademas libres (Tucan por ejemplo), pero usarlos no seria tan divertido, así que me puse a recolectar los materiales para mi “manualidad”. Gestor de descargas ya tenia y no podía ser mejor que wget, solo faltaba el reconocimiento de caracteres, ocr que llaman; después de un poco de búsqueda apareció tesseract que sin lugar a dudas es el mejor programa de reconocimiento de caracteres que haya visto hasta el momento. Solo faltaban algunas librerías como pytesser para “comunicarse” con tesseract y  libxml2dom (requiere libxml2) para consultar el dom en documentos aun cuando estos estén mal formados.

Como ven, lo bonito del software libre es que con tan solo una búsqueda nos encontramos con programas maravillosos, los cuales podemos utilizar sin ninguna restricción (sí, ya se que esto no es completamente cierto). Ahora si, con ustedes el script:

import libxml2dom
import urllib2
import urllib
import pytesser
import Image

MAX_TRY = 5 # intentos antes de rendirse
WAIT_TIME = 45 # tiempo de espera en segundos
CAPTCHA_INPUT_NAME = "captcha"
TEMP_FILE_NAME = "tempImg.gif"
ID_DOWNLOAD_LINK = "downloadlink"

def urlopen(url, data={}):
"""Abrir un recurso remoto, si se pasa data se envía por POST"""
req = urllib2.Request(url, urllib.urlencode(data) if data else None)
try:
sock = urllib2.urlopen(req)
try:
data = sock.read()
finally:
sock.close()
except IOError:
print "el archivo no existe"
else:
return data

def html2dom(page):
"""Retornar representación DOM de un documento html"""
dom = libxml2dom.parseString(page, html=1)
return dom

def tag(elem, tag):
"""Encontrar descendientes de un elementos por su tag"""
elements = elem.getElementsByTagName(tag)
return elements[0] if len(elements) == 1 else elements

def id(elem, Id):
return elem.getElementById(Id)

def attr(elem, attr):
"""Retornar atributo de un elemento"""
return elem.getAttribute(attr)

def save_img(uri):
"""Guardar imagen en local"""
data = urlopen(uri)
temp = file(TEMP_FILE_NAME, 'wb')
temp.write(data)
temp.close()

def resolver_captcha():
"""Resolver captcha"""
data = Image.open(TEMP_FILE_NAME)
return pytesser.image_to_string(data)[:4]

def fill_form(page):
"""Recolectar datos de formulario"""
try:
form = tag(page, 'form')
img = tag(form, 'img')

save_img(attr(img, "src"))

# crear diccionario valores a enviar
data = dict([(attr(i, 'name'),attr(i, 'value')) for i in tag(form, 'input')])

# "rellenar" campo captcha
captcha = resolver_captcha()
data[CAPTCHA_INPUT_NAME] = captcha
except:
return None
else:
return (data, captcha)

# Donde la magia sucede XD
def get(url):
"""Descargar archivo"""
times = 1

# solo links de megaupload
if url.find('http://www.megaupload.com/') != 0:
print "%s no es un link de megaupload" % url
return 0

# Abrir pagina de formulario
page = html2dom( urlopen(url) )

while True:
# llenamos el formulario
data, captcha = fill_form(page)

if not data or times == MAX_TRY:
print "Error al abrir %s, puede que el link haya sido deshabilitado" % url
return 0

print "%s ==> intento %dncaptcha = %s" % (url, times, captcha)
times += 1

# Enviamos formulario por POST
page = html2dom( urlopen(url, data) )

# Si el captcha esta correcto obtenemos la página de descarga
download_page = id(page, ID_DOWNLOAD_LINK)

if download_page:
download_link = tag( download_page , 'a' )
import subprocess, time

# please wait.... XD
time.sleep(WAIT_TIME)

args = ['wget', '-c', attr(download_link, 'href')]

# empezamos a descargar ^_^
proc = subprocess.Popen(args)
retcode = proc.wait()
return 1

def get_from_file(file_path):
"""descargar múltiples archivos leyendo urls almacenadas en un archivo"""
try:
sock = file(file_path)
try:
lines = sock.readlines()
finally:
sock.close()
except IOError:
print "el archivo %s no existe" % file_path
else:
for line in lines:
url = line.strip()
if url:
get( url )

if __name__ == "__main__":
import sys

arg = sys.argv[1:]

if arg[0] == "-f":
get_from_file(arg[1])
elif "http" in arg[0]:
get(arg[0])
else:
print "uso:nmget link_descarganmget -f /ruta/archivo/links_descargan"

Claro que le hacen falta algunas funcionalidades, pero para lo que lo necesito me basta y me sobra, ademas como ya dije existe una gran variedad de programas que hacen lo mismo. Si lo desean pueden descargar los archivos desde el siguiente enlace:

P.D.: Se aceptan criticas, solo no sean tan duros XD

Categories
opinion software libre

¿Software gratis = libre?

Es común escuchar a personas confundir los programas gratis (shareware, tryware…) con software libre, tal vez esto se deba en parte a una mala interpretación del término en ingles FREE el cual se puede traducir como libre o gratis, pero sin duda alguna la principal causa es la pereza falta de información ya que con solo buscar en Wikipedia ó Google se puede encontrar mucha información al respecto; en este aburridor pequeño articulo expondré algunas de las ideas tras el software libre, sin adentrarme en discusiones sobre si este es mejor que el software privativo.

Aunque el software libre es gratis, esto es algo secundario y no estrictamente necesario, lo realmente importante aquí, es su filosofía, la cual se basa en dar a los usuario la libertad de usarlo, estudiarlo, modificarlo, mejorarlo, adaptarlo y redistribuirlo, con la única restricción de no agregar ninguna restricción adicional al software, un programa se puede considerar libre si respeta todas y cada una de las siguientes libertades:

  • Libertad Cero: “usar el programa con cualquier propósito”. Esta libertad se contrapone a ciertas licencias privativas que restringen el uso del software a un determinado propósito, o que prohíben su uso para determinadas actividades
  • Libertad Uno: “Estudiar cómo funciona el programa, y adaptarlo a sus necesidades”. Esto nos permite descubrir funciones ocultas, averiguar cómo realiza determinada tarea, descubrir que otras posibilidades tiene, que es lo que le falta para hacer. El adaptar el programa a mis necesidades implica poder suprimirle partes que no nos interesan, agregarle partes, copiarle una parte y adicionarla a otro programa; en general esta libertad es de gran ayuda para estudiantes como yo que encuentran en estos una gran cantidad de ejemplos e inspiración.
  • Libertad Dos: “Distribuir copias”. De esta libertad se deriva que el software libre sea gratis ya que si yo adquiero una copia del programa, soy libre de redistribuirlo, ya sea gratis o con algún costo.
  • Libertad Tres: “Mejorar el programa, y liberar las mejoras al público”.

Como podemos ver el software libre no es libre simplemente por ser gratis, sino por darnos la libertad de usarlo como y para lo que lo queramos, al contrario de los programas privativos; privativos no por ser de empresas privadas, sino por privar al usuario de su libertad, los cuales ya sean de pago o gratuitos, estamos a merced de sus creadores ya que estos son los únicos que pueden realizar cambios al programa y/o brindar soporte técnico, monopolizando el producto, agregando que en el caso de los de pago, ponen precios elevadísimos a un producto al cual el único “derecho” que tenemos es el de usarlo, convirtiéndonos en criminales ante la ley al utilizarlo sin adquirir una licencia o compartirlo con alguien que lo necesita. por otro lado el software libre es desarrollado en conjunto por una comunidad en la cual todas las ideas son tenidas en cuenta (desde que aporten algo bueno) y donde todo el proceso es abierto y cualquier persona con conocimientos en programación puede ver en su código fuente, colaborar y hasta tomar parte del programa y usarlo en otra aplicación, acelerando el proceso de producción de nuevos programas al no tener que reinventar la rueda, además que al utilizar parte de un producto que ya lleva tiempo en el “mercado”, asegura en parte su estabilidad y fiabilidad. Podría seguir aquí todo el día nombrando las diferencias y ventajas del software libre con respecto al software privativo, pero como me canso demasiado rápido de escribir mejor los remito a fuentes con mucha información como lo es la free software foundation, GNU o pueden escuchar al mismísimo creador del movimiento del software libre Richard Satallman en un vídeo en español que realizo con motivo del FLISOL 2009.

Espero que después de haber leído este artículo (¿acaso alguien me lee?) por lo menos no vuelvas a confundir los programas gratis con los libres, y si escuchas a alguien que lo hace, puedas abofetearlo corregirlo y explicarle las diferencias; hasta la próxima ^_^