Cómo evitar el raspado del contenido del blog en WordPress

¿Está buscando una manera de evitar que los spammers y los estafadores roben el contenido de su blog de WordPress usando contenido raspadores?

Es muy frustrante como propietario de un sitio web ver que alguien está robando su contenido sin permiso, monetizándolo, superándolo en Google y robando su audiencia.

En este artículo, cubriremos qué es el scraping de contenido de blogs, cómo puede reducir y prevenir el scraping de contenido e incluso cómo beneficiarse del scraping de contenido a su favor.

¿Qué es el scraping de contenido de blogs?

El raspado de contenido del blog es cuando el contenido se toma de numerosas fuentes y se vuelve a publicar en otro sitio. Por lo general, esto se hace automáticamente a través de la fuente RSS de su blog.

Eliminar contenido es tan fácil ahora que cualquiera puede iniciar un sitio de WordPress, insertar un tema gratuito o comercial e instalar algunos plugins que extraerán contenido de blogs seleccionados.

¿Por qué los Content Scrapers roban mi contenido?

Algunos de nuestros usuarios nos han preguntado por qué están robando mi contenido. La respuesta simple es porque eres EXCELENTE. La verdad es que estos raspadores de contenido tienen motivos ocultos. A continuación, se muestran algunas de las razones por las que alguien debería raspar su contenido:

  • Comisión de afiliados – Hay algunos vendedores afiliados sucios que solo quieren aprovechar el sistema para ganar algo de dinero extra. Utilizarán su contenido y el de otros para dirigir el tráfico a su sitio a través del motor de búsqueda. Estos sitios generalmente están dirigidos a un nicho específico, por lo que tienen productos relacionados que están promocionando.
  • Generación líder – A menudo vemos a abogados y agentes inmobiliarios haciendo esto. Quieren parecerse a los líderes de la industria en sus pequeñas comunidades. No tienen el ancho de banda para producir contenido de calidad, por lo que salen y recopilan contenido de otras fuentes. A veces, ni siquiera lo saben porque pagan unos $ 30 al mes para agregar contenido y ayudarlos a mejorar su SEO. Hemos conocido a bastantes en el pasado.
  • Ingresos por publicidad – Algunas personas solo quieren crear un «centro» de conocimiento. Una ventanilla única para los usuarios de un nicho específico. A menudo notamos que se está raspando el contenido de nuestro sitio. El raspador siempre responde, lo hice por el bien de la comunidad. Excepto que el sitio está lleno de anuncios.

Estas son solo algunas de las razones por las que alguien robaría su contenido.

¿Cómo capturar raspadores de contenido?

La captura de raspadores de contenido es una tarea tediosa y que requiere mucho tiempo. Hay algunas formas en las que puede capturar raspadores de contenido.

Busca en Google con los títulos de tus publicaciones.

Sí, es tan doloroso como parece. Este método probablemente no valga la pena, especialmente si está escribiendo sobre un tema muy popular.

Rastrear

Si agrega enlaces internos en sus publicaciones, notará un trackback si un sitio roba su contenido. De esta manera, es más o menos el raspador lo que le dice que están raspando su contenido.

Si está utilizando Akismet, muchos de estos trackbacks aparecerán en la carpeta SPAM. Nuevamente, esto solo funcionará si tiene enlaces internos en sus publicaciones.

Ahrefs

Si tiene acceso a una herramienta de SEO como Ahrefs, puede monitorear sus vínculos de retroceso y vigilar el contenido robado.

Cómo administrar Content Scrapers

Hay pocos enfoques que las personas adoptan cuando se trata de recopiladores de contenido: el enfoque No hacer nada, el enfoque Eliminar o el enfoque Aprovecharse de ellos.

Echemos un vistazo a cada uno de ellos.

El enfoque de no hacer nada

Este es, con mucho, el enfoque más simple que puede tomar. Por lo general, los bloggers más populares lo recomendarían, ya que se necesita MUCHO tiempo para luchar contra los raspadores.

Por supuesto, si es un blog conocido como Smashing Magazine, CSS-Tricks, Problogger u otros, no tienen que preocuparse por eso. Son sitios autorizados a los ojos de Google.

Sin embargo, conocemos algunos sitios buenos que se han marcado como raspadores porque Google pensó que sus raspadores eran el contenido original. Entonces, este enfoque no siempre es el mejor en nuestra opinión.

Enfoque de derribo

Esto es exactamente lo contrario del «enfoque de no hacer nada». En este enfoque, simplemente póngase en contacto con el raspador y pídale que retire el contenido.

Si se niegan a hacerlo o simplemente no responden a sus solicitudes, entonces presenta una DMCA (Ley de Derechos de Autor del Milenio Digital) con su anfitrión.

En nuestra experiencia, la mayoría de los sitios web de scraping no tienen un formulario de contacto. Si es así, utilícelo. Si no tienen el formulario de contacto, debe realizar una búsqueda de Whois.

Búsqueda de Whois

Puede ver la información de contacto en el contacto administrativo. Por lo general, el contacto administrativo y técnico es el mismo.

También mostrará el registrador de dominios. Las empresas de alojamiento web y los registradores de dominios más populares tienen DMCA o formularios de correo electrónico. Puede ver que esta persona específica está con HostGator debido a sus servidores de nombres. HostGator tiene un módulo para Quejas de DMCA.

Si el servidor de nombres es algo así como ns1.theirdomain.com, debe profundizar más realizando búsquedas de IP inversas y buscando IP.

También puede utilizar un servicio de terceros para DMCA.com para mudanzas.

Jeff Starr en su artículo sugieren bloquear la IP del atacante. Acceda a sus registros para obtener su dirección IP, luego bloquéelo con algo como esto en su archivo raíz .htaccess:

Deny from 123.456.789

También puede redirigirlos a una fuente ficticia haciendo algo como esto:

RewriteCond %{REMOTE_ADDR} 123.456.789.
RewriteRule .* http://dummyfeed.com/feed [R,L]

Puede ser realmente creativo aquí, como sugiere Jeff. Envíelos a fuentes de texto muy grandes llenas de Lorem Ipsum. Puedes enviarles imágenes repugnantes de cosas malas. También puede enviarlos directamente a su servidor, lo que provocará un bucle infinito que bloqueará su sitio.

El último enfoque que tomamos es explotarlos.

Cómo aprovechar Content Scrapers

Este es nuestro enfoque para manejar los raspadores de contenido y resulta bastante bueno. Ayuda a nuestro SEO y nos ayuda a ganar dinero extra.

La mayoría de los raspadores utilizan su fuente RSS para robar su contenido. Estas son algunas de las cosas que puede hacer:

  • Conexión interna – Tienes que vincular mucho las publicaciones de tu blog. Cuando tiene enlaces internos en su publicación, lo ayuda a aumentar las visitas a la página y reducir la tasa de rebote en su sitio. En segundo lugar, lo lleva de regreso a las personas que están robando su contenido. Finalmente, te permite robar su audiencia. Si eres un bloguero talentoso, entonces entiendes el arte de los enlaces internos. Debe colocar sus enlaces en palabras clave interesantes. Haga que sea tentador para el usuario hacer clic en él. Si lo hace, la audiencia del raspador también hará clic en él. Así es, sacó a un visitante de su sitio y lo llevó de regreso a donde debería haber estado en primer lugar.
  • Autoenlazar palabras clave con enlaces de afiliados – Hay algunos plugins como ThirstyAffiliates que reemplazarán automáticamente las palabras clave asignadas con enlaces de afiliados,
  • Sea creativo con el pie de página RSS – Puede usar el plugin de SEO All in One para agregar elementos personalizados a su pie de página RSS. Puede agregar prácticamente cualquier cosa que desee aquí. Conocemos a algunas personas a las que les gusta promocionar sus productos entre los lectores de RSS. Luego agregarán pancartas. Adivina qué, ahora esos banners también aparecerán en el sitio web de estos raspadores. En nuestro caso, siempre agregamos un pequeño descargo de responsabilidad al final de nuestras publicaciones en nuestros canales RSS. De esta manera, obtenemos un vínculo de retroceso al artículo original del sitio scraper que permite que Google y otros motores de búsqueda sepan que somos autoridades. También les permite a sus usuarios saber que el sitio está robando nuestro contenido.

Consulte nuestra guía sobre cómo comprobar el pie de página del feed RSS en WordPress para obtener más consejos e ideas.

Cómo puede reducir y prevenir el scraping de blogs de WordPress

Mientras que si adopta nuestro enfoque de muchos enlaces internos, agregar enlaces de afiliados, banners RSS y esas posibilidades es que reducirá el raspado de contenido en gran medida. Si acepta la sugerencia de Jeff Starr de redirigir los raspadores de contenido, eso también detendrá esos raspadores. Aparte de lo que hemos compartido anteriormente, hay algunos otros trucos que puede utilizar.

Resumen y alimentación RSS completa

Ha habido un debate en la comunidad de blogs sobre si se debe tener una fuente RSS completa o una fuente RSS resumida. No entraremos en muchos detalles sobre ese debate, sin embargo, una de las PROS de tener un feed RSS solo de resumen es que evita el raspado de contenido.

Puede cambiar la configuración iniciando sesión en su panel de administración de WordPress y yendo a continuación Configuración »Lectura. Luego, cambie la configuración de cada artículo en una presentación de noticias en tiempo real: Resumen.

Trackback de SPAM

Los trackbacks y pingbacks ciertamente han tenido grandes usos, sin embargo, ahora se abusa constantemente de ellos.

Los temas suelen mostrar trackbacks y pingbacks debajo o en los comentarios. Esto le da al spammer un incentivo para raspar su sitio y enviar trackbacks. Si lo aprueba incorrectamente, obtienen un vínculo de retroceso y una mención de su sitio. Aquí se explica cómo desactivar los trackbacks en todas las publicaciones futuras.

Aquí hay un artículo que le mostrará cómo deshabilitar los trackbacks y pings en publicaciones existentes de WordPress también.

¿El raspado de contenido es siempre bueno?

Podría ser. Si ve que está ganando dinero con el sitio del raspador, por supuesto que puede serlo. Si ve mucho tráfico desde el sitio de un raspador, entonces puede serlo.

En la mayoría de los casos, sin embargo, no lo es. Siempre debes intentar hacer despegar tu contenido. Pero te darás cuenta de que a medida que tu blog crece, es casi imposible realizar un seguimiento de todos los raspadores de contenido. Seguimos enviando quejas de DMCA, sin embargo, sabemos que hay muchos otros sitios que están robando nuestro contenido y que no podemos seguir.

Esperamos que este artículo le haya ayudado a evitar que el contenido de blogs se raspe en WordPress. También puede consultar nuestra guía sobre cómo prevenir el robo de imágenes en WordPress.

¿Te ha resultado útil??

0 / 0

Deja una respuesta 0

Tu dirección de correo electrónico no será publicado. Required fields are marked *