RE: Schema's crawling mismatch

Hi Álvaro,

If the structured data is not added when the page is first rendered, it is not seen. A test showed that only the first 10 products were added to the SD collection on its first load.

I don’t see any dynamic microdata.

It looks like 12 products are initially displayed on the page, and then further products are added as the user scrolls. So it seems like a mismatch between the SD generator and your initial page size.

Because of this scroll-to-add mechanism, how would Google find those extra products as its bots do not scroll, and I see no links to the secondary pages that would contain them on the initial load?

Not sure why the real Googlebot is different. Could it be shown different content that has 12 products per page, all marked up,  and pagination links? Looking at the rendered source for the real Googlebot crawl should help clarify if Googlebot is being shown different content.
--
Tony

From: Álvaro Pichó <alvaro@seolevante.com>
Sent: Wednesday, April 24, 2024 6:34 PM
To: schema.org Mailing List <public-schemaorg@w3.org>
Subject: Re: Schema's crawling mismatch


Last email about this topic:

Looks like it isn't a problem of mine, other ecommerce with ItemList are only crawled up to 10th itemListElement.

You can check 1 case here: https://validator.schema.org/#url=https%3A%2F%2Fwww.misako.com%2Fmujer%2Fmochilas%2Fantirrobo


... with 45 products, only crawled up to 10th.

Is this something Schema and/or Google should be concerned about?

It's not my business, I'm just reporting my little finding.

L&R,

Álvaro Pichó Torres

Consultor SEO

seolevante.com<https://seolevante.com/>

619 832 611<tel:+34619832611>

[cid:image001.png@01DAA52B.1E5DA000]<https://seolevante.com/consultor-seo-alvaro-picho/>

NOTA IMPORTANTE: Le informamos que este mensaje está dirigido a las personas indicadas en el encabezamiento y que puede contener información confidencial. Si Ud. lo ha recibido por error le rogamos nos avise inmediatamente y destruya este mensaje. En ningún caso deberá copiar, distribuir o tomar iniciativa alguna en relación con su contenido. En cumplimiento de lo previsto en la Ley Orgánica 15/1999, de 13 de diciembre de Protección de Datos de Carácter Personal, le comunicamos su e-mail junto con los datos que nos facilite y nos haya facilitado, constan en un fichero titularidad de Álvaro Pichó Torres a los efectos de mantener el contacto con Ud. Puede ejercitar sus derechos de acceso, cancelación, rectificación y en su caso, oposición, enviando un escrito al efecto, acompañado de una fotocopia de su D.N.I., bien respondiendo a este correo electrónico, bien a la siguiente dirección: C/Cuenca, nº41- pta. 14. 46008-Valencia.



El 24/04/2024 09:37, Álvaro Pichó escribió:

Hello again dear community,

Perhpas may I say, that this Structured data is built with:

1) Static JSON-LD: for CollectionPage

2) Dinamic Microdata: for ItemList

3) With Plugin: Schema & Structured Data for WP & AMP by Magazine3 for Wordpress: Custom Schema for JSON, Automated for ItemList.

Always correctly verified



Maybe it's a problem of mine or of the plugin. Do you have the same problem with your ecommerce + ItemList?

So, it can be I'm askig about my problem, not a Schema's problem.



I will be very grateful for any answer,



With L&R,

Álvaro Pichó Torres

Consultor SEO

seolevante.com<https://seolevante.com/>

619 832 611<tel:+34619832611>

[cid:image001.png@01DAA52B.1E5DA000]<https://seolevante.com/consultor-seo-alvaro-picho/>

NOTA IMPORTANTE: Le informamos que este mensaje está dirigido a las personas indicadas en el encabezamiento y que puede contener información confidencial. Si Ud. lo ha recibido por error le rogamos nos avise inmediatamente y destruya este mensaje. En ningún caso deberá copiar, distribuir o tomar iniciativa alguna en relación con su contenido. En cumplimiento de lo previsto en la Ley Orgánica 15/1999, de 13 de diciembre de Protección de Datos de Carácter Personal, le comunicamos su e-mail junto con los datos que nos facilite y nos haya facilitado, constan en un fichero titularidad de Álvaro Pichó Torres a los efectos de mantener el contacto con Ud. Puede ejercitar sus derechos de acceso, cancelación, rectificación y en su caso, oposición, enviando un escrito al efecto, acompañado de una fotocopia de su D.N.I., bien respondiendo a este correo electrónico, bien a la siguiente dirección: C/Cuenca, nº41- pta. 14. 46008-Valencia.



El 24/04/2024 07:46, Álvaro Pichó escribió:

Good morning dear community,

I have found some mismatches between what Google crawls and what Schema crawls in its validator, which this is the same result as in Rich Results Test.

It's about Product List Pages in ecommerce sites with ItemList and the number of itemListElement crawled.

Both, Schema's validator and Google's Rich Results Test, they find 10 in 10 products as itemListElement even if there are 12 or 18.

I continue with the case of a listing of 12 products per page.



At first I thought that I lost the ones corresponding to 11th and 12th product, but my surprise was that when validating the /page/2/, the structured data validators see on page 2, 11 and 12, up to the twentieth (20th) product.

For a moment I thought this was the same as what Google crawls and saw, until I go to 'View crawled page' (crawled content with Javascript execution) and I see that Google's crawling and indexing yes it sees 11th and 12th.

So there is a mismatch between both, Schema's and Gogole's, crawlers: schema sees one thing, Google sees another.

The problem is not about crawling and indexing by itself (both crawlers see all), a mismatch is being created that looks like this a Cloaking problem, like a 'light' cloaking problem.

If I've 48 products linked to this Product List Page (PLP) 12 by 12, on /page/3/, for example, Google crawls 25th product to 36th, and Schema 21th to 30th, both crawls are different in content.

Every body can check it by himself on their client's ecommerce sites, I share my screenshots:

1) My validated ItemList counts only up to 10th itemListElement:

[cid:image002.jpg@01DAA52B.1E5DA000]

2) 11th product shown on PLP 1...

[cid:image003.jpg@01DAA52B.1E5DA000]

3) Appears on /page/2/ for Schema's validator:

[cid:image004.jpg@01DAA52B.1E5DA000]

4) Finally, as I tweeted about this to dear John Mueller https://twitter.com/Alvaro_Picho/status/1782689276959830319 and he answered me about indexing, I checked View crawled page, and I confirm myself that Google yes it crawls what I show, 12 products:

[cid:image005.jpg@01DAA52B.1E5DA000]

So, mismatch confirmed.

More proofs, Rich Results Test, only up to 10th:

[cid:image006.jpg@01DAA52B.1E5DA000]



I think this is an interesting topic to share with this excellent community of passionate professionals.

With Love & Respect,

Álvaro Pichó Torres

Consultor SEO

seolevante.com<https://seolevante.com/>

619 832 611<tel:+34619832611>

[cid:image001.png@01DAA52B.1E5DA000]<https://seolevante.com/consultor-seo-alvaro-picho/>

NOTA IMPORTANTE: Le informamos que este mensaje está dirigido a las personas indicadas en el encabezamiento y que puede contener información confidencial. Si Ud. lo ha recibido por error le rogamos nos avise inmediatamente y destruya este mensaje. En ningún caso deberá copiar, distribuir o tomar iniciativa alguna en relación con su contenido. En cumplimiento de lo previsto en la Ley Orgánica 15/1999, de 13 de diciembre de Protección de Datos de Carácter Personal, le comunicamos su e-mail junto con los datos que nos facilite y nos haya facilitado, constan en un fichero titularidad de Álvaro Pichó Torres a los efectos de mantener el contacto con Ud. Puede ejercitar sus derechos de acceso, cancelación, rectificación y en su caso, oposición, enviando un escrito al efecto, acompañado de una fotocopia de su D.N.I., bien respondiendo a este correo electrónico, bien a la siguiente dirección: C/Cuenca, nº41- pta. 14. 46008-Valencia.

Received on Monday, 13 May 2024 02:37:00 UTC