Ciber Geek >

SEO

Google Chrome ahora muestra resultados en la barra de direcciones

Hoy mientras buscaba información sobre la cotización en la bolsa de Twitter me encontré con una nueva funcionalidad en Google Chrome que muestra información extra en el listado de sugerencias.

chrome barra direcciones

Resultados en la barra de direcciones

Como pueden ver al comenzar una búsqueda en inglés, Chrome automáticamente muestra información resumida sobre el resultado que mas tarde se muestra en el “cuadro de respuestas”, o “Answer Box”, como comúnmente se le llama a las respuestas que se muestran sobre el listado de resultados.

Por el momento la funcionalidad no está disponible para búsquedas en español, ya que probé con otras palabras claves relacionadas con las condiciones meteorológicas y demás, pero solo se obtenían resultados en la barra de direcciones al realizar la búsqueda en inglés.

Esta funcionalidad seguramente tenga en un futuro un impacto en el SEO, ya que si bien es difícil ganarle a la información que muestra Google como parte del Knowledge Graph, será imposible si el usuario no llega siquiera a la pagina de resultados.

El viagra en las universidades argentinas

No todo el mundo está al tanto del funcionamiento de Google, para los que no lo saben, el buscador determina la posición de una página mediante diferentes señales, una de estas son los links que se dirigen hacia un sitio, y también otros métodos como por ejemplo redirecciones, algo que seguramente han visto al entrar a una página y que rápidamente son dirigidos a otra.

¿Qué tienen que ver las universidades y el viagra?

Si leyeron el párrafo anterior, se darán cuenta que para posicionar un sitio en una búsqueda hay que conseguir enlaces o links hacia el sitio que quieren que aparezca en las primeras posiciones de los resultados de Google, y es aquí donde las universidades y muchos otros sitios son víctimas de hackers que aplican técnicas de SEO (optimización para motores de búsqueda) para ganar terreno en los resultados del buscador. El viagra es un negocio muy redituable, y es por eso que muchos de los sitios que son víctimas de estos ataques son utilizados para posicionar paginas relacionadas con este producto.

Ojo, el viagra no es el único, se puede encontrar de todo, incluso links para posicionar una página de videos sexuales de famosos, alquileres baratos, y todo lo que se les pueda ocurrir, y aún más cosas que no se imaginan.

¿Por qué universidades?

Si bien es tema de discusión, se cree que los links provenientes de sitios con dominios .edu (instituciones educativas) o .gov (instituciones gubernamentales) tienen más peso que los provenientes de otros sitios. De todos modos, todos los sitios son atacados por igual, pero obviamente estas instituciones son el blanco más deseado, y aparentemente son más vulnerables que lo esperado, al menos por mi.

Lista de ejemplo de instituciones vulneradas

Entre las víctimas de estos ataques se encuentran las siguientes instituciones:

  • Facultad de Ciencias Médicas de la Universidad Nacional del Litoral
  • Portal Educativo de La Rioja (IDUKAY)
  • Universidad Nacional de Mar del Plata
  • Facultad de Psicología de la Universidad Nacional de Córdoba
  • Facultad de Turismo de la Universidad Nacional de Comahue
  • Facultad de Ciencias de la Salud de la Universidad Nacional de Entre Ríos
  • Universidad de San Pablo – Tucumán
  • Centro de Investigación Cinematográfica
  • Colegio Provincial Técnico Nº 748
  • Facultad Regional Santa Fe de la Universidad Tecnologica Nacional

La lista sigue, y mucho, además hay que considerar que también hay sitios hackeados que fueron utilizados para fines diferentes.

universidad vulnerada viagra

Ejemplo de una pagina de una universidad

¿Cómo encontrar los sitios comprometidos?

El método que utilicé para hacerlo es “artesanal”, ya que en realidad se utiliza a Google como herramienta, sí, el mismo Google que los hackers intentan burlar.

Esta es la búsqueda realizada para encontrar los sitios:

https://www.google.com/search?q=inurl:.edu.ar+viagra

Pueden cambiar “viagra” por otras palabras usadas comúnmente, por ejemplo: cialis, rolex, etcétera.

Entro al sitio y parece limpio

Ajá, es la idea, campeón. Hay muchas técnicas para esconder los enlaces, en las más simple se esconde dentro del contenido del sitio, y no es posible verlo a simple vista, pero si se pueden ver al urgar el código fuente de la pagina, para verlo puede ir en su navegador a “Ver código de fuente” o CTRL+U en Chrome.

Ok, mire el código de fuente y no hay nada raro. Bien, Sherlock. La otra técnica para ocultar información es un poco más compleja, comúnmente conocida como Cloaking en el rubro del posicionamiento, y se basa en mostrar contenido diferente según quien mira la pagina, de éste modo el sitio que ve Google es diferente al que ven los usuarios.

¿Cómo se si están usando Cloaking?

Hay una forma difícil y efectiva, y otra simple pero no tan efectiva, les voy a enseñar la forma simple, y en verdad es muy simple, solo basta con realizar la búsqueda que compartimos más arriba y en vez de clickear en el titulo del resultado, hacer clic en el caret o triangulo que se encuentra al final de la URL del mismo,  se van a desplegar una o dos opciones, ustedes deben seleccionar la que dice “Cached”, y de ese modo pueden ver el sitio como lo vió Google cuando entró a ver el contenido del sitio.

cache de google

Ver un sitio como lo ve Google

¿Qué importancia tiene esto?

Bueno, la lista es larga pero que tengan acceso para agregar estos enlaces muchas veces significa que también lo tienen para acceder a información privada de los integrantes (alumnos, docentes) de la institución.

Ojo, eso no es lo peor, muchos de estos sitios redireccionan a paginas que pueden explotar vulnerabilidades en su navegador o plugins (Flash, Java), y ahí la cosa se torna más peligrosa, ya que si el atacante consigue acceso a su PC, bueno, ustedes sabrán el riesgo que eso implica.

Phishing, otras veces se utilizan estos ataques para crear paginas que son utilizadas en esos mails falsos que llegan diciendo ser alguien que no son, en general personificando bancos e instituciones financieras, y en las que al acceder a un enlace nos piden información o instalan algo en nuestra PC.

¿Los políticos consumen viagra?

Que pregunta, lo dejo a su criterio:

https://www.google.com/search?q=inurl:.gov.ar+viagra

 

viagra google .gov.ar

Apaa, pero mirá vos!

Una aclaración final

Mas de uno en este momento debe estar odiando a aquellos que hacen SEO, pero tengan en cuenta que estas son técnicas conocidas como BlackHat SEO, y no son aprobadas por la mayoría de la comunidad, y menos que menos por Google, que se encuentra activamente luchando contra estos trucos para burlar sus algoritmos. Si Google lo encuentra usando estas estrategias, tarde o temprano van a ser penalizados, lo malo es que penaliza tanto al sitio donde se encuentran los enlaces como al sitio al cual se dirigen éstos.

El SEO y la accesibilidad

Éste post tiene como objetivo dar el puntapié inicial a una serie de post relacionados con el tema de la web y la accesibilidad, o como le dice el resto del mundo, accesibilidad web.

cuadrado negro, metafora para representar la falta de vision

La web para no videntes

Shall we?

Bueno, para empezar a estudiar el tema elegí hacerlo desde un punto de vista de algo que conozco un poco más y con lo que me siento cómodo, que es el SEO, específicamente on-page, y la razón por la cual me apoyo en él se debe a la gran similitud que hay entre las técnicas para hacer un sitio accesible para personas con discapacidades y hacer lo mismo pensando en los robots de los buscadores.

Accesibilidad y SEO

Las similitudes son muchas, empezando por las imágenes, el atributo alt es algo que no dudamos que es importante, no solo para mejorar nuestro ranking, sobre todo en la búsqueda de imágenes, sino que también no es raro acceder a un sitio y que no carguen las imágenes. De hecho, puede ser un buen truco para “acelerar” la conexión a Internet. Sin dudas, casi todos lo consideramos algo necesario.

foto del robot r2d2

R2D2 tiene mas onda que Asimo

Éste es un primer ejemplo de las similitudes, y de como el SEO on-page puede ser beneficioso por varios motivos.

Contenido estructurado

Uno de los puntos que resaltan en cualquier guía sobre SEO, y que también está íntimamente relacionada con la accesibilidad. Empezamos por la etiqueta title, tener un titulo descriptivo es muy importante, para todos, no es nada nuevo, así que no se dejen llevar por la moda del clickbaiting que hizo tan popular a BuzzFeed.

Es importante respetar las estructuras, tablas con títulos (th), listados en vez de párrafos con saltos de linea, y algo especial son los formularios, las etiquetas son importantes.

Los links, evitar cuando se pueda los click aquí, clic allá, etc. Los lectores de pantalla no leen el atributo title, así que ténganlo en cuenta. Además, es bueno para el SEO =) (los emoticones deben ser algo complicado también, queda para la próxima). También eviten llenar el comienzo de su sitio con links y contenido no relacionado, y si lo hacen, al menos pongan primero un link con el texto “Pasar al contenido”, o algo similar.

No todos son no-videntes, hay otros temas a considerar, como las personas que tienen algún tipo de daltonismo, y enfermedades similares, en las cuales los contrastes son importantes.

HTML5 por suerte hace las cosas un poco mejor, y además, si usan Bootstrap, éste framework se ve que fue hecho con la accesibilidad en mente, ya que constantemente fomenta las buenas practicas.

Internet Explorer, es uno de los browsers mas usados, y si bien el tamaño de la muestra es chico, ésto es lo que dicen en ésta encuesta realizada por WebAIM.

Si quieren ir leyendo más, pueden acceder a la sección dedicada a la accesibilidad web de la W3C.

Guion bajo vs guion del medio en Google

Diferencia entre guion bajo y guion del medio y como afecta al SEO

Quienes tengan un poco de experiencia en el posicionamiento en buscadores sabrán que siempre es recomendable utilizar el guion del medio para separar palabras en un URL, pero hasta ahora, al menos yo, sabía que era así pero no la razón por la que se seguía esa convención.

¿Por que es mejor utilizar el guion del medio antes que el guion bajo?

Según Matt Cutts, el guion bajo se interpreta como un carácter mas porque en los comienzos de Google los programadores tomaron la decisión basados en el código fuente de cualquier programa, donde en general los nombre de funciones, variables y demás se separan con un guion bajo cuando están compuestos por mas de una palabra, y por ésta razón Google toma las cadenas separadas por guion bajo como una sola cadena.

El guion del medio en cambio es un carácter que es interpretado como un separador de cadenas, cuando se encuentra un guion del medio las cadenas se interpretan por separado, lo que mejora la obtención de keywords por parte de la araña de Google.

¿Como afecta al Ranking?

En realidad, el impacto en el ranking de un sitio por el uso de los guiones es muy pequeño, ya que Google utiliza muchos otros factores a la hora de calcular el PageRank, por lo cual Matt dice que si ya tenemos un sitio establecido que utiliza el guion bajo como separador no deberíamos preocuparnos, solamente se recomienda tener en cuenta el uso del guion medio en proyectos nuevos.

Si quieren pueden ver el vídeo de Matt Cutts hablando del tema, aunque está en inglés.

 

NOTA: En la actualidad como separador se utiliza mucho el Camel Casing, pero esto a mi parecer es algo que viene mas de la programación orientada a objetos.

Como sacar las META que agrega WordPress en el Head

Evitar que WordPress cree Meta tags en el header

En las ultimas versiones de WordPress se han comenzado a agregar por defecto algunas meta tags y links que pueden acarrear problemas y no aportan demasiado al SEO. El peligro específicamente lo presenta la etiqueta generator ya que permite conocer cual es la versión de WordPress que estamos usando, lo que puede ayudar a un atacante al momento de intentar explotar algún bug que WordPress pueda tener.

Las etiquetas que se añaden al HEAD son las siguientes:
– EditURI
– wlwmanifest
– index
generator

Las 2 primeras son usadas por los programas que nos permiten manejar el contenido desde nuestra PC y no desde el CMS, así que básicamente son inútiles si manejamos el contenido desde el CMS.

Eliminar las etiquetas que WordPress agrega en el Header

Para eliminarlas debemos agregar en el archivo functions.php las siguiente lineas de código.

Si les interesa eliminar el resto de las etiquetas dejen un comentario y les paso el código, aunque el resto son útiles para el SEO y la navegabilidad del sitio.