lunes, 10 de noviembre de 2008

Google

Mr. I/O [blackhat4all@gmail.com]

Gestión de la información en la vía del Hacking: La búsqueda profunda paso a paso.

(Propuesta de curso de la universidad para todos BlackHat a aprobar directamente por los hermanos del gremio)

El propósito de este material.

Estamos viviendo en una era de revolución constante en Internet. Una era en que la globalización del conocimiento debe florecer; cuestión esta que muchas veces se cumple, pues podemos consultar documentos distantes – bibliografía que personas solidarias han compartido – e importantes, que pueden encausar nuestra investigaciones profesionales o personales.


Suele suceder que necesitamos encontrar una información, que tenemos la Pc, la conexión, y el tiempo, tras lo cual nos enfrentaremos entonces los siguientes dilemas: ¿Cómo buscar?, ¿Qué buscar? - O más sencillo aun - ¿Con que buscar?

El marcado propósito de este material es darles respuesta de manera sencilla a estas interrogantes desde la óptica del neófito, que se irá especializando hasta alcanzar – digamos – cierto desarrollo de esta habilidad comprendida, que recibe el nombre – compuesto – de gestionar información.

El material está orientado hacia la formación de una cultura de gestión elemental, dentro de las fronteras de los que podrían llamarse parámetros no comunes de la gestión.

Requerimientos necesarios para enfrentar este aprendizaje:

1. Necesidades de gestión de información.
2. Pc
3. Conexión a Internet
4. Navegador
5. El Google como buscador

¿Quiénes realmente necesitan estos conocimientos?
Todo el mundo en general. En especial mencionaré solo el pequeño grupo de los:
• Estudiantes, desde los niveles secundarios hasta la universidad, incluidos los IPI del país.
• Egresados de las distintas enseñanzas profesionales.
• Profesionales de la gestión de la información entre los que podemos destacar a los bibliotecarios.
• Investigadores de todo tipo.

Como es natural – en nuestro estilo – para comenzar con el estudio del tema nos referiremos al marco teórico referencial en el cual se esclarecerán los conceptos básicos ceñidos en de este documento, pilares necesarios para el ulterior desarrollo de la habilidad que nos proponemos potenciar: gestionar información.

Nuestra herramienta de búsqueda

Como ya se presentó, la herramienta que se propone que aprendan a utilizar para realizar las búsquedas será el Google. Esta no ha sido escogida por simple capricho, pero preferimos que sean las propias palabras de Michal Piotrowski extraídas – y traducidas por los autores – de la introducción de un genial artículo titulado: Dangerous Google – Searching for secrets, donde explicó que:

Google suministra un aproximado del 80 % de todas las peticiones de búsquedas en Internet, convirtiéndose próximamente en el más popular motor de búsquedas. Su popularidad no se debe solamente a su excelente eficacia en la búsqueda, sino que también es extensiva a sus posibilidades para ordenarla.

Del Google, que sin dudas es desconocido por quienes no están aun iniciados en la gestión de recursos, y que es mal comprendido por muchos de los que hacen uso diario del mismo, mucho se ha escrito, de manera brillante o no, en un intento por hace asequible este concepto.

Al revisar la bibliografía consultada para la preparación de este material se decide a criterio de los autores asumir la definición que nos brinda Wikipedia:“es, posiblemente, el motor de búsqueda en Internet más grande y más usado. Ofrece una forma rápida y sencilla de encontrar información en la web, con acceso a un índice de más de 8.168 millones de páginas web. Según la compañía, actualmente Google responde a más de 200 millones de consultas al día.”

De este análisis se desglosan los subsiguientes conceptos útiles a nuestro esquema conceptual ya que el próximo término a definir es precisamente motor de búsqueda el cual es definido como “un programa de computadoras que busca por palabras específicas y devuelve una lista de documentos en los cuales ellas aparecen […]” . De este tipo de software podemos añadir también que ”ayuda a los usuarios a encontrar la información almacenada en un ordenador personal, o en una red informática como Internet. El usuario indica los términos de la búsqueda, por lo general escribiendo a máquina una palabra o palabras clave, y el buscador extrae una lista de vínculos con sitios en Internet, ya sea explorando el contenido almacenado en los ordenadores objeto de la búsqueda, o bien analizando un índice de los datos contenidos en ellos.”

Un motor de búsqueda es a su vez conocido como buscador. Estos basan su funcionamiento “construyendo —y actualizando regularmente— un enorme índice de archivos y páginas web. Esto se hace con la ayuda de una especie de navegador automatizado que rastrea permanentemente esta telaraña global y enumera cada página encontrada en un índice ordenado según las palabras contenidas en ella, prestando especial atención a las que figuran en títulos y otros epígrafes”

Generalmente, en la lista de resultados obtenidos con un buscador las páginas quedan clasificadas según
“el número de otros sitios que tengan vínculos con ellas. Así, se supone que, cuanto más útil sea una página, más sitios habrá que inviten al usuario a visitarla. Google promovió esta técnica a finales de la década de 1990 con una tecnología llamada PageRank. Pero este no es el único modo de clasificar resultados; también se usan docenas de otros criterios, que variarán de unos buscadores a otros.”

Pero muchas veces los resultados de la búsqueda contienen vínculos patrocinados:
“La mayoría de las veces el motor de búsqueda identifica estos eslabones patrocinados como tales, pero muchos usuarios inexpertos de Internet a menudo tienen problemas para distinguir entre páginas patrocinadas y resultados obtenidos sin patrocinio. Los vínculos patrocinados proveen a los propietarios del buscador de su principal fuente de ingresos.”

De que viene esta propuesta

Esta propuesta viene con la invitación de compartir conocimientos relativos a la gestión de información – clasifiquémosla como – desde adentro, por lo tanto estamos implicando soluciones desde la óptica quick&dirt – o sea hacker – programación incluida.

Solo para que se tenga una idea de que se expone, los autores proponen un ejercicio práctico con el que se pretende fundamentar la validez de este material. Una vez que lo realices, sino te interesa el resultado, sencillamente esto no es para ti.

De lo contrario solo grita por email, pide a los editores de nuestra magazine que este taller comience, y ellos contaran votos a favor, los cuales si suman lo suficiente serán el catalizador para que, número tras número, este conocimiento drene hacia ti.

Ejercicio de cómo hacer

Asumiremos que tienes todos los requerimientos citados al comienzo.
Primero: por el método del clic derecho crea un nuevo documento .txt en el escritorio y cámbiale el nombre a buscador.html.
Segundo: abre el documento con el método del clic derecho, en la opción abrir con y escoge bloc de notas.
Tercero: copia el texto script que a continuación se anexa y pégalo en el documento abierto en el bloc de notas.
Cuarto: salva el documento, minimiza y dale doble clic al documento que creaste y que se encuentra en el escritorio.
Quinto: prueba y has una búsqueda; prueba luego y cámbiale el nombre al botón, has tus primeros cambios a este ambiente, impresiona a tus amigos mientras aprendes ;)

Ejemplo a copiar
<!-- Search Google -->
<form method="get" action="http://www.google.com/search">
<input type="text" name="q" size=31 maxlength=255 value="">
<input type="submit" name="sa" value="Buscador de Mr.I/O">
</form>
<!-- Search Google -->


Apúntate luego, di no al aborto y pide a BlackHat que este proyecto nazca, dale tu voto de confianza a esta cruzada por el aprendizaje, a este taller que tiene ganas de nacer, y que fue pensado simplemente para ti.

Mr I/O



Artículos relacionados


No hay comentarios: