W3C home > Mailing lists > Public > xmlschema-dev@w3.org > March 2013

Re: TR: COSOLUCE : Urgent --> Problème de validation de schéma

From: C. M. Sperberg-McQueen <cmsmcq@blackmesatech.com>
Date: Mon, 4 Mar 2013 08:18:18 -0700
Cc: "C. M. Sperberg-McQueen" <cmsmcq@blackmesatech.com>, <bernard.odier@inria.fr>, <cyan@cosoluce.fr>, <xmlschema-dev@w3.org>, <w3c-france@w3.org>
Message-Id: <8269CFA0-356C-4315-9264-D8FA04CF967F@blackmesatech.com>
To: <j-durand@cosoluce.fr> <j-durand@cosoluce.fr>
Thank you for your mail.  (I regret that I am unable to respond in French; my
apologies.)

I wonder if the problem may be related to the measures W3C has undertaken to 
deal with the problem of excessive DTD and schema traffic [1, 2].  DTD and XSD 
resources change very slowly and can therefore be cached very effectively, and
W3C serves such resources with appropriate cache-control headers.  But some
programs and libraries (including apparently some in very wide use) insist on 
hitting the W3C servers every time they wish to use a DTD or schema; the result 
has been a very high load on W3C's network connections and servers.  In order to
deal with the problem, W3C's system administrators have set things up so that 
DTDs and schema documents are served very slowly; impatient software may 
misinterpret this as a network timeout, and perhaps that is what is happening in 
this case.  But IP addresses which hit the W3C site repeatedly for the same resource
within a very short period of time may also be blacklisted, especially if the user agent
string is not set in such a way as to allow the software responsible for the requests to
be identified reliably.  That might also explain the behavior observed. 

There are several measures you, or any software developer or user affected by
these issues can undertake.

- You can and should set up and use some mechanism to allow the schema documents
in question to be retrieved without hitting the W3C server.  A local caching proxy
is one possibility; the use of an XML Catalog is another.  Pointers to further information 
on these is available in the blog post at [2].

- As software developers, you should ensure that your software can use XML Catalogs
for stable resources like the DSig schema, and that it is easy for the user to tell the
software where to find the catalog.  (My personal view is that it's helpful if you ship a
catalog with your software and make use of a catalog the default, but some smart
people disagree with me on that.)

- As software developers, you should also ensure that when you request a 
schema from W3C, you use the appropriate facilities of your http library to set
an informative user-agent string, so that cases of malconfigured installations of your
software can be identified and fixed.

There may be other steps you can take; I refer you to [2] for other ideas.

It is possible, of course, that I have completely misunderstood the nature of the
issue and that the origin of your trouble is completely unrelated to W3C's 
defensive measures against excessive DTD and schema traffic.  (But even if
the problem is some other network issue, a local cache or an XML catalog will
help to defend against it.)

I hope this helps.

--C. M. Sperberg-McQueen
  Black Mesa Technologies LLC

[1] http://www.w3.org/Help/Webmaster.html#slowdtd
[2] http://www.w3.org/blog/systeam/2008/02/08/w3c_s_excessive_dtd_traffic/




On Mar 1, 2013, at 6:08 AM, <j-durand@cosoluce.fr> <j-durand@cosoluce.fr> wrote:

> Merci pour votre retour
>  
> Voici la réponse de notre équipe réseau à ce sujet.
>  
> Par la même occasion, pouvez-vous de votre côté tester la validation du schéma de ce fichier exemple (en pj) ?
>  
> Encore merci
>  
> Cordialement,
>  
> <image002.gif>
>        Julien DURAND   I   Service Développement
>          Technopole Hélioparc - 2 av. Pierre Angot - 64053 Pau Cedex 9
>          Tel : 05.59.14.03.40 - Fax : 05.59.02.03.18
>  
> De : Pascal Clemot 
> Envoyé : vendredi 1 mars 2013 14:04
> À : COSOLUCE - Julien DURAND
> Objet : RE: COSOLUCE : Urgent --> Problème de validation de schéma
>  
> pas un pb de standard, mais bien un pb réseau.
>  
> la requête http semble être interrompue par un équipement réseau intermédiaire au bout de 15 secondes
> cela ressemble à un timeout TCP…
>  
> <image001.png>
>  
> De : COSOLUCE - Julien DURAND 
> Envoyé : vendredi 1 mars 2013 13:52
> À : Pascal Clemot
> Objet : TR: COSOLUCE : Urgent --> Problème de validation de schéma
>  
> Pascal,
>  
> Pourrais-tu m’aider à répondre à cette demande stp ?
>  
> Thanks
>  
> <image002.gif>
>        Julien DURAND   I   Service Développement
>          Technopole Hélioparc - 2 av. Pierre Angot - 64053 Pau Cedex 9
>          Tel : 05.59.14.03.40 - Fax : 05.59.02.03.18
>  
> De : Bernard Odier [mailto:bernard.odier@inria.fr] 
> Envoyé : vendredi 1 mars 2013 12:14
> À : COSOLUCE - Julien DURAND; w3c-france@w3.org
> Cc : xmlschema-dev@w3.org; _Cosoluce Cyan
> Objet : RE: COSOLUCE : Urgent --> Problème de validation de schéma
>  
> Bien reçu, cependant le bureau France du W3C est un bureau de représentation, sans ressource d'experts ni de diagnostic.
>  
> Le W3C ne fait qu'émettre des spécifications, mais n'est pas organisé pour faire le suivi de leur mise en oeuvre, et ne fait aucun "blocage administratif" .
>  
> Par ailleurs, s'il s'agit d'un problème de connexion TCP (?) , alors c'est un problème de réseau, et non de standard du web.
>  
> Afin de me permettre d'identifier un expert au W3C quelque part dans le monde pour aller plus loin éventuellement, il faudrait me dire quel est à votre avis le standard du web qui poserait problème :  http , autre ?
>  
> Désolé de ne pas pouvoir intervenir davantage à ce stade.
>  
> Cdlt,
>  
> Bernard ODIER
> Office Manager, W3C France Office
> C° Inria, 23 Avenue d'Italie, Paris 75013 France
> bernard.odier@w3.org
> +33 6 07 71 81 16
> www.w3.org
> 
>  
>  
>  
>  
>  
>  
> De : j-durand@cosoluce.fr [mailto:j-durand@cosoluce.fr] 
> Envoyé : vendredi 1 mars 2013 11:33
> À : w3c-france@w3.org
> Cc : xmlschema-dev@w3.org; cyan@cosoluce.fr
> Objet : COSOLUCE : Urgent --> Problème de validation de schéma
> 
> Bonjour,
>  
> Nous sommes éditeur de logiciel et notamment du logiciel Cyan qui gère l’état civil des collectivités.
>  
> Je me permets de solliciter votre aide car depuis quelques jours nous avons un souci de validation de schéma que nous n’avions pas auparavant.
>  
> Un fichier exemple est en pièce jointe.
>  
> Le validateur de notre logiciel retourne cette erreur et bloque donc la transmission du fichier à l’INSEE qui nous a confirmé ne pas avoir fait de modifications sur leurs schémas :
> <image003.jpg>
>  
> Nous équipons environ 300 communes qui à l’heure actuelle ne peuvent plus transmettre ces bulletins à l’INSEE..
>  
> Pouvez-vous nous venir en aide suite à ce blocage ?
>  
> Pour info, nous avons effectué une multitude de tests de notre côté (antivirus, pare-feu, analyse des paquets réseaux, vérification avec l’INSEE, etc.)
> Une des pistes peut être l’analyse des trames ci-dessous :
>  
> Connexion au schéma http://www.w3.org/TR/2002/REC-xmldsig-core-20020212/xmldsig-core-schema.xsd :
>  
> -           la connexion est coupée au bout de 15 secondes pour le motif « Request forbidden by administrative rules » :
>  
> <image004.jpg>
>  
> Explications de la capture :
> 1.       Ligne 885 à Connexion demandée au schéma http://www.w3.org/TR/2002/REC-xmldsig-core-20020212/xmldsig-core-schema.xsd
> 2.       Ligne 1724 à (15sec. plus tard) : on arrive à déchiffrer (dans le détail) le message d’interdiction.
>  
>  
> En vous remerciant d’avance,
>  
>  
> Cordialement,
>  
> <image002.gif>
>        Julien DURAND   I   Service Développement
>          Technopole Hélioparc - 2 av. Pierre Angot - 64053 Pau Cedex 9
>          Tel : 05.59.14.03.40 - Fax : 05.59.02.03.18
>  
> <Bulletin_Test.xml>

-- 
****************************************************************
* C. M. Sperberg-McQueen, Black Mesa Technologies LLC
* http://www.blackmesatech.com 
* http://cmsmcq.com/mib                 
* http://balisage.net
****************************************************************
Received on Monday, 4 March 2013 15:19:03 GMT

This archive was generated by hypermail 2.2.0+W3C-0.50 : Monday, 4 March 2013 15:19:04 GMT