summaryrefslogtreecommitdiffstats
path: root/docs
diff options
context:
space:
mode:
authorLucien Gentis <lgentis@apache.org>2011-12-17 16:33:23 +0100
committerLucien Gentis <lgentis@apache.org>2011-12-17 16:33:23 +0100
commit0a914256967aec872a9ba8651fb009c37d4f8cf3 (patch)
tree845b1c9138e8734424fad7991f0bf9756a234349 /docs
parentAllow for changing of string more easily... (diff)
downloadapache2-0a914256967aec872a9ba8651fb009c37d4f8cf3.tar.xz
apache2-0a914256967aec872a9ba8651fb009c37d4f8cf3.zip
Update.
git-svn-id: https://svn.apache.org/repos/asf/httpd/httpd/trunk@1215514 13f79535-47bb-0310-9956-ffa450edef68
Diffstat (limited to 'docs')
-rw-r--r--docs/manual/caching.xml.fr1104
1 files changed, 663 insertions, 441 deletions
diff --git a/docs/manual/caching.xml.fr b/docs/manual/caching.xml.fr
index 9b1d7e3ba1..b55e606486 100644
--- a/docs/manual/caching.xml.fr
+++ b/docs/manual/caching.xml.fr
@@ -3,7 +3,7 @@
<?xml-stylesheet type="text/xsl" href="style/manual.fr.xsl"?>
<!-- French translation : Lucien GENTIS -->
<!-- Reviewed by : Vincent Deffontaines -->
-<!-- English Revision : 1174747 -->
+<!-- English Revision : 1210725 -->
<!--
Licensed to the Apache Software Foundation (ASF) under one or more
@@ -40,46 +40,50 @@
<section id="introduction">
<title>Introduction</title>
- <p>Depuis la version 2.2 du serveur HTTP Apache, les modules
- <module>mod_cache</module>
- et <module>mod_file_cache</module> ne sont plus jug&eacute;s exp&eacute;rimentaux
- et on consid&egrave;re qu'ils peuvent &ecirc;tre utilis&eacute;s en production. Ces
- architectures de mise en cache constituent un puissant concept
- d'acc&eacute;l&eacute;ration de la gestion HTTP, tant comme serveur web originel
- que comme mandataire.</p>
-
- <p>Le module <module>mod_cache</module> et son module de soutien
- <module>mod_cache_disk</module>
- permettent une mise en cache intelligente du point de vue HTTP.
- Le contenu proprement dit est stock&eacute; dans le cache,
- et mod_cache tente d'honorer tous les en-t&ecirc;tes HTTP et les options
- qui d&eacute;finissent la possibilit&eacute; de mise en cache du contenu. Il g&egrave;re non
- seulement le contenu local, mais aussi le contenu mandat&eacute;.
- <module>mod_cache</module>
- est con&ccedil;u pour des configurations de mise en cache simples ou complexes,
- dans lesquels vous traitez de contenu mandat&eacute;, de contenu local dynamique
- ou avez besoin d'acc&eacute;l&eacute;rer l'acc&egrave;s &agrave; des fichiers locaux qui sont modifi&eacute;s
- au cours du temps.</p>
-
- <p>Le module <module>mod_file_cache</module> quant &agrave; lui, constitue une
- forme de mise en cache plus basique, mais quelques fois int&eacute;ressante.
- Plut&ocirc;t que de g&eacute;rer la complexit&eacute; de s'assurer de mani&egrave;re active de la
- possibilit&eacute; de mise en cache d'URLs,
- <module>mod_file_cache</module> fournit des m&eacute;thodes pour la gestion
- et l'&eacute;dition de fichiers en m&eacute;moire afin de maintenir un cache de fichiers
- dans l'&eacute;tat o&ugrave; ils &eacute;taient la derni&egrave;re
- fois qu'httpd a d&eacute;marr&eacute;.
- En tant que tel, <module>mod_file_cache</module> a &eacute;t&eacute; con&ccedil;u pour am&eacute;liorer
- le temps d'acc&egrave;s &agrave; des fichiers locaux statiques qui ne sont modifi&eacute;s
- que rarement.</p>
-
- <p>Etant donn&eacute; que <module>mod_file_cache</module> constitue une
- impl&eacute;mentation de mise en cache relativement simple, mises &agrave; part les
- sections sp&eacute;cifiques sur les directives <directive
- module="mod_file_cache">CacheFile</directive> et <directive
- module="mod_file_cache">MMapFile</directive>, les explications fournies
- dans ce guide concernent l'architecture de mise en cache du
- module <module>mod_cache</module>.</p>
+ <p>Le serveur HTTP Apache offre tout un ensemble de fonctionnalit&eacute;s
+ de mise en cache qui ont &eacute;t&eacute; con&ccedil;ues pour am&eacute;liorer les performances
+ du serveur de diff&eacute;rentes mani&egrave;res.</p>
+
+ <dl>
+ <dt>Mise en cache HTTP &agrave; trois &eacute;tats RFC2616</dt>
+ <dd><module>mod_cache</module> et son module de fournisseur
+ <module>mod_cache_disk</module> proposent une mise en cache
+ intelligente de niveau HTTP. Le contenu proprement dit est
+ stock&eacute; dans le cache, et mod_cache vise &agrave; respecter tous les
+ en-t&ecirc;tes HTTP, ainsi que les options qui contr&ocirc;lent la mise en
+ cache du contenu comme d&eacute;crit dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html">Section
+ 13 de la RFC2616</a>. <module>mod_cache</module> peut g&eacute;rer des
+ configurations de mise en cache simples, mais aussi complexes
+ comme dans les cas o&ugrave; vous avez &agrave; faire &agrave; des contenus mandat&eacute;s,
+ &agrave; des contenus locaux dynamiques, ou lorsque vous avez besoin
+ d'acc&eacute;l&eacute;rer l'acc&egrave;s aux fichiers locaux situ&eacute;s sur disque
+ suppos&eacute; lent.
+ </dd>
+
+ <dt>Mise en cache d'objets partag&eacute;s de forme cl&eacute;/valeur &agrave; deux
+ &eacute;tats</dt>
+ <dd>
+ <module>mod_socache</module> et ses modules de fournisseurs
+ proposent une mise en cache d'objets partag&eacute;s &agrave; base de
+ couples cl&eacute;/valeur de niveau serveur. Ces modules sont
+ con&ccedil;us pour la mise en cache de donn&eacute;es de bas niveau comme
+ les sessions SSL et les donn&eacute;es d'authentification. les
+ serveurs d'arri&egrave;re-plan permettent le stockage des donn&eacute;es
+ au niveau serveur en m&eacute;moire partag&eacute;e, ou au niveau
+ datacenter dans un cache comme memcache ou distcache.
+ </dd>
+
+ <dt>Mise en cache de fichiers sp&eacute;cialis&eacute;e</dt>
+ <dd>
+ <module>mod_file_cache</module> offre la possibilit&eacute; de
+ pr&eacute;charger des fichiers en m&eacute;moire au d&eacute;marrage du serveur,
+ et peut am&eacute;liorer les temps d'acc&egrave;s et sauvegarder les
+ gestionnaires de fichiers pour les fichiers qui font l'objet
+ d'acc&egrave;s fr&eacute;quents, &eacute;vitant ainsi d'avoir &agrave; acc&eacute;der au disque
+ &agrave; chaque requ&ecirc;te.
+ </dd>
+ </dl>
<p>Pour tirer parti efficacement de ce document, les bases de HTTP doivent
vous &ecirc;tre famili&egrave;res, et vous devez avoir lu les sections
@@ -90,112 +94,201 @@
</section>
- <section id="overview">
+ <section id="http-caching">
- <title>Vue d'ensemble de la mise en cache</title>
+ <title>Mise en cache HTTP &agrave; trois &eacute;tats RFC2616</title>
<related>
<modulelist>
<module>mod_cache</module>
<module>mod_cache_disk</module>
- <module>mod_file_cache</module>
</modulelist>
<directivelist>
<directive module="mod_cache">CacheEnable</directive>
<directive module="mod_cache">CacheDisable</directive>
- <directive module="mod_file_cache">CacheFile</directive>
- <directive module="mod_file_cache">MMapFile</directive>
<directive module="core">UseCanonicalName</directive>
<directive module="mod_negotiation">CacheNegotiatedDocs</directive>
</directivelist>
</related>
- <p><module>mod_cache</module> peut faire intervenir deux phases
- principales pendant la dur&eacute;e de vie d'une requ&ecirc;te.
- En premier lieu, <module>mod_cache</module>
- est un module de mise en correspondance d'URLs, ce qui signifie que si
- une URL a &eacute;t&eacute; mise en cache, et que la version du cache de cette URL n'est
- pas arriv&eacute;e &agrave; expiration, la requ&ecirc;te sera trait&eacute;e directement par
- <module>mod_cache</module>.</p>
-
- <p>Ceci entra&icirc;ne que toutes autres actions qui se d&eacute;rouleraient normalement
- au cours du processus de traitement d'une requ&ecirc;te -- par exemple un
- traitement effectu&eacute; par <module>mod_proxy</module>, ou
- <module>mod_rewrite</module> --
- ne seront pas effectu&eacute;es. Mais c'est justement l'int&eacute;r&ecirc;t
- de la mise en cache pr&eacute;alable du contenu.</p>
-
- <p>Si l'URL ne se trouve pas dans le cache, <module>mod_cache</module>
- va ajouter un <a href="filter.html">filtre</a> au traitement de la requ&ecirc;te.
- Une fois le contenu localis&eacute; par httpd selon la conception courante, le
- filtre sera ex&eacute;cut&eacute; en m&ecirc;me temps que le contenu sera servi.
- S'il est d&eacute;termin&eacute; que le contenu peut &ecirc;tre mis en cache,
- il sera sauvegard&eacute; dans le cache pour une utilisation future.</p>
-
- <p>Si l'URL se trouve dans le cache, mais est arriv&eacute;e &agrave; expiration,
- le filtre est quand-m&ecirc;me ajout&eacute;, mais <module>mod_cache</module> va cr&eacute;er
- une requ&ecirc;te conditionnelle en arri&egrave;re-plan, pour d&eacute;terminer si la version
- du cache est encore &agrave; jour. Si la version du cache est encore &agrave; jour, ses
- meta-informations seront mises &agrave; jour et la requ&ecirc;te sera servie &agrave; partir du
- cache. Si la version du contenu n'est plus &agrave; jour, elle sera supprim&eacute;e et le
- filtre va sauvegarder le contenu mis &agrave; jour dans le cache
- au moment o&ugrave; il sera servi.</p>
+ <p>Le module <module>mod_cache</module> permet de tirer avantage du
+ m&eacute;canisme de mise en cache en ligne faisant partie
+ int&eacute;grante du protocole HTTP, et d&eacute;crit dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html">section
+ 13 de la RFC2616</a>.</p>
+
+ <p>A la diff&eacute;rence d'un cache simple cl&eacute;/valeur &agrave; deux &eacute;tats o&ugrave; le
+ contenu est supprim&eacute; lorsqu'il est p&eacute;rim&eacute;, un cache HTTP comporte un
+ m&eacute;canisme permettant de conserver temporairement un contenu p&eacute;rim&eacute;,
+ de demander au serveur original si ce contenu p&eacute;rim&eacute; a &eacute;t&eacute; modifi&eacute;,
+ et dans le cas contraire de le rendre &agrave; nouveau valide.</p>
+
+ <p>Une entr&eacute;e d'un cache HTTP peut se pr&eacute;senter sous un de ces trois
+ &eacute;tats :</p>
+
+ <dl>
+ <dt>Frais</dt>
+ <dd>
+ Si un contenu est suffisamment r&eacute;cent (plus jeune que sa
+ <strong>dur&eacute;e de fra&icirc;cheur</strong>), il est consid&eacute;r&eacute; comme
+ <strong>frais</strong>. Un cache HTTP peut servir un contenu
+ frais sans avoir &agrave; demander quoi que ce soit au serveur
+ d'origine.
+ </dd>
+ <dt>P&eacute;rim&eacute;</dt>
+ <dd>
+ <p>Si le contenu est trop ancien (plus vieux que sa
+ <strong>dur&eacute;e de fra&icirc;cheur</strong>), il est consid&eacute;r&eacute; comme
+ <strong>p&eacute;rim&eacute;</strong>. Un cache HTTP doit contacter le serveur
+ original pour v&eacute;rifier si le contenu, m&ecirc;me s'il est p&eacute;rim&eacute;, est
+ encore &agrave; jour avant de le servir au client. Soit le serveur
+ original va r&eacute;pondre en envoyant un contenu de remplacement si
+ le contenu p&eacute;rim&eacute; n'est plus &agrave; jour, soit dans le cas id&eacute;al il
+ renverra un code pour signaler au cache que le contenu est
+ encore &agrave; jour, et qu'il est inutile de le g&eacute;n&eacute;rer ou de
+ l'envoyer &agrave; nouveau. Le contenu repasse &agrave; l'&eacute;tat "frais" et le
+ cycle continue.</p>
+
+ <p>Le protocole HTTP permet au cache de servir des donn&eacute;es
+ p&eacute;rim&eacute;es dans certaines circonstances, comme lorsqu'une
+ tentative de rafra&icirc;chir une entr&eacute;e depuis un serveur original
+ se solde par un &eacute;chec avec un code d'erreur 5xx, ou lorsqu'une
+ autre requ&ecirc;te est d&eacute;j&agrave; en train d'essayer de rafra&icirc;chir la m&ecirc;me
+ entr&eacute;e. Dans ces cas, un en-t&ecirc;te <code>Warning</code> est ajout&eacute;
+ &agrave; la r&eacute;ponse.</p>
+ </dd>
+ <dt>Non Existent</dt>
+ <dd>
+ Si le cache est plein, il se r&eacute;serve la possibilit&eacute; de supprimer
+ des entr&eacute;es pour faire de la place. Une entr&eacute;e peut &ecirc;tre
+ supprim&eacute;e &agrave; tout moment, qu'elle soit fra&icirc;che ou p&eacute;rim&eacute;e.
+ L'outil <a href="programs/htcacheclean.html">htcacheclean</a>
+ peut &ecirc;tre utilis&eacute; &agrave; la demande, ou lanc&eacute; en tant que d&eacute;mon afin
+ de conserver la taille du cache ou le nombre d'inodes en de&ccedil;&agrave; de
+ valeurs sp&eacute;cifi&eacute;es. Cet outil essaie cependant de
+ supprimer les entr&eacute;es p&eacute;rim&eacute;es avant les entr&eacute;es fra&icirc;ches.
+ </dd>
+ </dl>
+
+ <p>Le fonctionnement d&eacute;taill&eacute; d'un cache HTTP est d&eacute;crit dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html">Section
+ 13 de la RFC2616</a>.</p>
+
+ <section>
+ <title>Interaction avec le serveur</title>
+
+ <p>Le module <module>mod_cache</module> interagit avec le serveur
+ &agrave; deux niveaux possibles en fonction de la directive <directive
+ module="mod_cache">CacheQuickHandler</directive> :
+ </p>
+
+ <dl>
+ <dt>Phase du gestionnaire rapide</dt>
+ <dd>
+ <p>Cette phase se d&eacute;roule tr&egrave;s t&ocirc;t au cours du traitement de
+ la requ&ecirc;te, juste apr&egrave;s l'interpr&eacute;tation de cette derni&egrave;re. Si
+ le contenu se trouve dans le cache, il est servi imm&eacute;diatement
+ et pratiquement tout le reste du traitement de la requ&ecirc;te est
+ court-circuit&eacute;.</p>
+
+ <p>Dans ce sc&eacute;nario, le cache se comporte comme s'il avait
+ &eacute;t&eacute; "boulonn&eacute;" &agrave; l'entr&eacute;e du serveur.</p>
+
+ <p>Ce mode poss&egrave;de les meilleures performances car la
+ majorit&eacute; des traitements au niveau du serveur sont
+ court-circuit&eacute;s. Cependant, il court-circuite aussi les
+ phases d'authentification et d'autorisation du traitement
+ au niveau du serveur, et il doit donc &ecirc;tre utilis&eacute; avec
+ prudence lorsque que ces phases sont importantes.</p>
+ </dd>
+ <dt>Phase du gestionnaire normal</dt>
+ <dd>
+ <p>Cette phase se d&eacute;roule tr&egrave;s tard au cours du traitement
+ de la requ&ecirc;te, en fait apr&egrave;s toutes les phases de ce
+ traitement.</p>
+
+ <p>Dans ce sc&eacute;nario, le cache se comporte comme s'il avait
+ &eacute;t&eacute; "boulonn&eacute;" &agrave; la sortie du serveur.</p>
+
+ <p>Ce mode offre la plus grande souplesse, car il permet
+ de faire intervenir la mise en cache en un point
+ pr&eacute;cis&eacute;ment sp&eacute;cifi&eacute; de la cha&icirc;ne de filtrage, et le
+ contenu issu du cache peut &ecirc;tre filtr&eacute; ou personnalis&eacute;
+ avant d'&ecirc;tre servi au client.</p>
+ </dd>
+ </dl>
+
+ <p>Si l'URL ne se trouve pas dans le cache,
+ <module>mod_cache</module> ajoutera un <a
+ href="filter.html">filtre</a> &agrave; la cha&icirc;ne de filtrage afin
+ d'enregistrer la r&eacute;ponse dans le cache, puis passera la main
+ pour permettre le d&eacute;roulement normal de la suite du traitement
+ de la requ&ecirc;te. Si la mise en cache du contenu est autoris&eacute;e, il
+ sera enregistr&eacute; dans le cache pour pouvoir &ecirc;tre servi &agrave; nouveau
+ ; dans le cas contraire, le contenu sera ignor&eacute;.</p>
+
+ <p>Si le contenu trouv&eacute; dans le cache est p&eacute;rim&eacute;, le module
+ <module>mod_cache</module> convertit la requ&ecirc;te en
+ <strong>requ&ecirc;te conditionnelle</strong>. Si le serveur original
+ renvoie une r&eacute;ponse normale, elle est enregistr&eacute;e dans le cache
+ en lieu et place du contenu p&eacute;rim&eacute;. Si le serveur original
+ renvoie une r&eacute;ponse "304 Not Modified", le contenu repasse &agrave;
+ l'&eacute;tat "frais" et est servi par le filtre au lieu d'&ecirc;tre
+ sauvegard&eacute;.</p>
+ </section>
<section>
<title>Am&eacute;lioration du taux de pr&eacute;sence dans le cache</title>
- <p>Lors de la mise en cache de contenu g&eacute;n&eacute;r&eacute; localement, le
- positionnement de la directive
+ <p>Lorsqu'un serveur virtuel est connu sous la forme d'un des
+ nombreux alias du serveur, la d&eacute;finition de la directive
<directive module="core">UseCanonicalName</directive> &agrave;
- <code>On</code> peut am&eacute;liorer de mani&egrave;re spectaculaire le taux de
- pr&eacute;sence dans le cache. Ceci est du au fait que le nom d'h&ocirc;te de l'h&ocirc;te
- virtuel qui sert le contenu constitue une partie de la cl&eacute; de cache.
+ <code>On</code> peut augmenter de mani&egrave;re significative le nombre
+ de correspondances positives dans le cache. Ceci est du au fait
+ que la cl&eacute; du cache contient le nom d'h&ocirc;te du serveur virtuel.
Avec <directive module="core">UseCanonicalName</directive> positionn&eacute;e
&agrave; <code>On</code>,
les h&ocirc;tes virtuels poss&eacute;dant plusieurs noms de serveur ou alias ne
g&eacute;n&eacute;reront pas d'entit&eacute;s de cache diff&eacute;rentes, et le contenu sera mis en
cache en faisant r&eacute;f&eacute;rence au nom d'h&ocirc;te canonique.</p>
- <p>Les documents mis en cache ne seront servis qu'en r&eacute;ponse &agrave; des
- requ&ecirc;tes de type URL, car la mise en cache est effectu&eacute;e lors de la phase
- de traduction de l'URL en nom de fichier.
- En g&eacute;n&eacute;ral, cela n'a que peu d'effet, &agrave; moins que vous n'utilisiez les
- <a href="howto/ssi.html">Inclusions C&ocirc;t&eacute; Serveur (SSI)</a>;</p>
-
- <example>
-&lt;!-- L'inclusion suivante peut &ecirc;tre mise en cache --&gt;<br />
-&lt;!--#include virtual="/footer.html" --&gt;<br />
-<br />
-&lt;!-- L'inclusion suivante ne peut pas &ecirc;tre mise en cache --&gt;<br />
-&lt;!--#include file="/path/to/footer.html" --&gt; <br />
- </example>
-
- <p>Si vous utilisez les SSI, et voulez b&eacute;n&eacute;ficier de la vitesse de
- service depuis le cache, vous devez utiliser des inclusions de type
- <code>virtual</code>.</p>
</section>
<section>
- <title>P&eacute;riodes d'expiration</title>
-
- <p>La p&eacute;riode d'expiration par d&eacute;faut pour les entit&eacute;s du cache est
- d'une heure; elle peut cependant &ecirc;tre facilement modifi&eacute;e &agrave; l'aide de
+ <title>Dur&eacute;e de fra&icirc;cheur</title>
+
+ <p>Un contenu bien form&eacute; destin&eacute; &agrave; &ecirc;tre mis en cache doit d&eacute;clarer
+ explicitement une dur&eacute;e de fra&icirc;cheur via les champs
+ <code>max-age</code> ou <code>s-maxage</code> de l'en-t&ecirc;te
+ <code>Cache-Control</code>, ou en incluant un en-t&ecirc;te
+ <code>Expires</code>.</p>
+
+ <p>De plus, un client peut passer outre la dur&eacute;e de fra&icirc;cheur
+ d&eacute;finie pour le serveur original en ajoutant son propre en-t&ecirc;te
+ <code>Cache-Control</code> &agrave; la requ&ecirc;te. Dans ce cas, c'est la
+ dur&eacute;e de fra&icirc;cheur la plus basse entre la requ&ecirc;te et la r&eacute;ponse
+ qui l'emporte.</p>
+
+ <p>Lorsque cette dur&eacute;e de fra&icirc;cheur est absente de la requ&ecirc;te ou
+ de la r&eacute;ponse, une dur&eacute;e de fra&icirc;cheur par d&eacute;faut s'applique. La
+ dur&eacute;e de fra&icirc;cheur par d&eacute;faut des entr&eacute;es du cache est d'une heure
+ ; elle peut cependant &ecirc;tre facilement modifi&eacute;e &agrave; l'aide de
la directive <directive
- module="mod_cache">CacheDefaultExpire</directive>. Cette valeur par
- d&eacute;faut n'est utilis&eacute;e que lorsque la source originale du contenu ne
- pr&eacute;cise pas de p&eacute;riode d'expiration ou d'heure de derni&egrave;re
- modification.</p>
+ module="mod_cache">CacheDefaultExpire</directive>.</p>
<p>Si une r&eacute;ponse ne contient pas d'en-t&ecirc;te <code>Expires</code> mais
inclut un en-t&ecirc;te <code>Last-Modified</code>, <module>mod_cache</module>
- peut d&eacute;duire une p&eacute;riode d'expiration en se basant sur la valeur de la
- directive <directive
+ peut d&eacute;duire une dur&eacute;e de fra&icirc;cheur en se basant sur une
+ heuristique, qui peut &ecirc;tre contr&ocirc;l&eacute;e via la directive <directive
module="mod_cache">CacheLastModifiedFactor</directive>.</p>
- <p>La p&eacute;riode d'expiration des contenus locaux peut &ecirc;tre ajust&eacute;e finement
- en utilisant le module <module>mod_expires</module>.</p>
+ <p>Pour les contenus locaux, ou les contenus distants qui ne
+ sp&eacute;cifient pas leur propre en-t&ecirc;te <code>Expires</code>,
+ <module>mod_expires</module> permet de r&eacute;gler finement la dur&eacute;e de
+ fra&icirc;cheur via les param&egrave;tres <code>max-age</code> et
+ <code>Expires</code>.</p>
- <p>On peut aussi contr&ocirc;ler la p&eacute;riode d'expiration maximale en utilisant
+ <p>On peut aussi contr&ocirc;ler la dur&eacute;e de fra&icirc;cheur maximale en utilisant
la directive <directive module="mod_cache">CacheMaxExpire</directive>.</p>
</section>
@@ -203,64 +296,62 @@
<section>
<title>Guide succinct des requ&ecirc;tes conditionnelles</title>
- <p>Lorsqu'un contenu est arriv&eacute; &agrave; expiration dans le cache et fait
- l'objet d'une nouvelle demande d'acc&egrave;s, plut&ocirc;t que traiter directement
- la requ&ecirc;te originale, httpd pr&eacute;f&egrave;re utiliser une
- requ&ecirc;te conditionnelle.</p>
-
- <p>HTTP propose toute une panoplie d'en-t&ecirc;tes qui permettent &agrave; un client,
- ou au cache de distinguer les diff&eacute;rentes versions d'un m&ecirc;me contenu. Par
- exemple, si une ressource a &eacute;t&eacute; servie avec un en-t&ecirc;te "Etag:", il est
- possible de cr&eacute;er une requ&ecirc;te conditionnelle contenant un en-t&ecirc;te
- "If-None-Match:". Si une ressource a &eacute;t&eacute; servie avec un en-t&ecirc;te
- "Last-Modified:", il est possible de cr&eacute;er une requ&ecirc;te conditionnelle
- contenant un en-t&ecirc;te "If-Modified-Since:", etc....</p>
-
- <p>Lorsqu'une telle requ&ecirc;te conditionnelle est cr&eacute;&eacute;e, la reponse diff&egrave;re
- selon que le contenu satisfait ou non aux conditions. Si une requ&ecirc;te est
- cr&eacute;&eacute;e avec un en-t&ecirc;te "If-Modified-Since:", et le contenu n'a pas &eacute;t&eacute;
- modifi&eacute; depuis le moment indiqu&eacute; dans la requ&ecirc;te, alors un laconique
- "304 Not Modified" est retourn&eacute;.</p>
-
- <p>Si le contenu a &eacute;t&eacute; modifi&eacute;, il est servi comme si la requ&ecirc;te n'avait
- pas &eacute;t&eacute; conditionnelle &agrave; l'origine.</p>
-
- <p>Les b&eacute;n&eacute;fices des requ&ecirc;tes conditionnelles pour ce qui concerne la
- mise en cache sont de deux sortes. Premi&egrave;rement, quand une telle requ&ecirc;te
- est envoy&eacute;e au processus en arri&egrave;re-plan, il sera ais&eacute; de d&eacute;terminer
- si le contenu que devra servir le processus en arri&egrave;re-plan correspond
- au contenu stock&eacute; dans le cache, sans &ecirc;tre oblig&eacute; de transmettre la
- totalit&eacute; de la ressource.</p>
-
- <p>Deuxi&egrave;mement, les requ&ecirc;tes conditionnelles sont en g&eacute;n&eacute;ral moins
- co&ucirc;teuses en ressources pour le processus en arri&egrave;re-plan.
- Pour ce qui est des fichiers
- statiques, l'action type est un appel &agrave; <code>stat()</code> ou un appel
- syst&egrave;me similaire, pour d&eacute;terminer si la taille du fichier ou sa date de
- modification ont chang&eacute;. Ainsi, m&ecirc;me si httpd met en cache le contenu
- local, un contenu arriv&eacute; &agrave; expiration pourra &ecirc;tre servi plus rapidement
- depuis le cache s'il n'a pas &eacute;t&eacute; modifi&eacute;, parce que la lecture depuis le
- cache est plus rapide que la lecture depuis le processus en arri&egrave;re-plan
- (&agrave; comparer &agrave; la diff&eacute;rence de vitesse entre la lecture depuis un cache en
- m&eacute;moire avec <module>mod_cache_disk</module> et la lecture depuis un disque).</p>
+ <p>Lorsqu'un contenu du cache est p&eacute;rim&eacute;, httpd modifie la requ&ecirc;te
+ pour en faire une requ&ecirc;te conditionnelle</p>
+
+ <p>Lorsque la r&eacute;ponse originale du cache contient un en-t&ecirc;te
+ <code>ETag</code>, <module>mod_cache</module> ajoute un en-t&ecirc;te
+ <code>If-None-Match</code> &agrave; la requ&ecirc;te envoy&eacute;e au serveur
+ d'origine. Lorsque la r&eacute;ponse originale du cache contient un en-t&ecirc;te
+ <code>Last-Modified</code>, <module>mod_cache</module> ajoute un en-t&ecirc;te
+ <code>If-Modified-Since</code> &agrave; la requ&ecirc;te envoy&eacute;e au serveur
+ d'origine. Dans ces deux cas, la requ&ecirc;te devient une requ&ecirc;te
+ <strong>conditionnelle</strong>.</p>
+
+ <p>Lorsqu'un serveur d'origine re&ccedil;oit une requ&ecirc;te conditionnelle,
+ il v&eacute;rifie si le param&egrave;tre Etag ou Last-Modified a &eacute;t&eacute; modifi&eacute; en
+ fonction des param&egrave;tres de la requ&ecirc;te. Si ce n'est pas le cas, il
+ r&eacute;pondra avec le message lapidaire "304 Not Modified". Ceci
+ informe le cache que le contenu est p&eacute;rim&eacute; mais encore &agrave; jour, et
+ peut &ecirc;tre utilis&eacute; tel quel pour les prochaines requ&ecirc;tes jusqu'&agrave; ce
+ qu'il atteigne &agrave; nouveau sa date de p&eacute;remption.</p>
+
+ <p>Si le contenu a &eacute;t&eacute; modifi&eacute;, il est servi comme s'il s'agissait
+ d'une requ&ecirc;te normale et non conditionnelle.</p>
+
+ <p>Les requ&ecirc;tes conditionnelles offrent deux avantages. D'une
+ part, il est facile de d&eacute;terminer si le contenu du serveur
+ d'origine correspond &agrave; celui situ&eacute;
+ dans le cache, et ainsi d'&eacute;conomiser la consommation de ressources
+ n&eacute;cessaire au transfert du contenu dans son ensemble.</p>
+
+ <p>D'autre part, un serveur d'origine bien con&ccedil;u sera configur&eacute; de
+ telle mani&egrave;re que les requ&ecirc;tes conditionnelles n&eacute;cessitent pour
+ leur production bien moins de ressources qu'une r&eacute;ponse compl&egrave;te.
+ Dans le cas des fichiers statiques, il suffit en g&eacute;n&eacute;ral d'un
+ appel syst&egrave;me de type <code>stat()</code> ou similaire pour
+ d&eacute;terminer si la taille ou la date de modification du fichier a
+ &eacute;t&eacute; modifi&eacute;e. Ainsi, m&ecirc;me un contenu local pourra &ecirc;tre servi plus
+ rapidement depuis le cache s'il n'a pas &eacute;t&eacute; modifi&eacute;.</p>
+
+ <p>Il serait souhaitable que tous les serveurs d'origine
+ supportent les requ&ecirc;tes conditionnelles, car dans le cas
+ contraire, ils r&eacute;pondent comme s'il s'agissait d'une requ&ecirc;te
+ normale, et le cache r&eacute;pond comme si le contenu avait &eacute;t&eacute;
+ modifi&eacute; et enregistre ce dernier. Le cache se comporte alors
+ comme un simple cache &agrave; deux &eacute;tat, o&ugrave; le contenu est servi s'il
+ est &agrave; jour, ou supprim&eacute; dans le cas contraire.</p>
</section>
<section>
<title>Que peut-on mettre en cache ?</title>
- <p>Comme mentionn&eacute; plus haut, les deux styles de mise en
- cache de httpd
- fonctionnent diff&eacute;remment; la mise en cache de
- <module>mod_file_cache</module> conserve les contenus des fichiers
- tels qu'ils &eacute;taient au d&eacute;marrage de httpd. Quand une requ&ecirc;te pour un
- fichier mis en cache par ce module est envoy&eacute;e, elle est intercept&eacute;e
- et le fichier mis en cache est servi.</p>
-
- <p>La mise en cache de <module>mod_cache</module>, quant &agrave; elle, est
- plus complexe. Lors du traitement d'une requ&ecirc;te, le module de mise en
- cache d&eacute;terminera si le contenu peut &ecirc;tre mis en cache, s'il ne l'a
- pas d&eacute;j&agrave; &eacute;t&eacute; auparavant. Les conditions qui permettent de d&eacute;terminer
- la possibilit&eacute; de mise en cache d'une r&eacute;ponse sont :</p>
+ <p>La liste compl&egrave;te des conditions n&eacute;cessaires pour qu'une
+ r&eacute;ponse puisse &ecirc;tre enregistr&eacute;e dans un cache HTTP est fournie
+ dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html#sec13.4">section
+ 13.4 Response Cacheability de la RFC2616</a>, et peut se r&eacute;sumer
+ ainsi :</p>
<ol>
<li>La mise en cache doit &ecirc;tre activ&eacute;e pour cette URL. Voir les
@@ -273,9 +364,6 @@
<li>La requ&ecirc;te doit &ecirc;tre de type HTTP GET.</li>
- <li>Si la requ&ecirc;te contient un en-t&ecirc;te "Authorization:", la r&eacute;ponse ne
- sera pas mise en cache.</li>
-
<li>Si la r&eacute;ponse contient un en-t&ecirc;te "Authorization:", elle doit aussi
contenir une option "s-maxage", "must-revalidate" ou "public"
dans l'en-t&ecirc;te "Cache-Control:".</li>
@@ -316,28 +404,46 @@
<section>
<title>Qu'est ce qui ne doit pas &ecirc;tre mis en cache ?</title>
- <p>En bref, tout contenu qui varie beaucoup avec le temps, ou en fonction
- de particularit&eacute;s de la requ&ecirc;te qui ne sont pas couvertes par la
- n&eacute;gociation HTTP, ne doit pas &ecirc;tre mis en cache.</p>
-
- <p>Un contenu dynamique qui varie en fonction de l'adresse IP du
- demandeur, ou est modifi&eacute; toutes les 5 minutes, ne devra en g&eacute;n&eacute;ral
- pas &ecirc;tre mis en cache.</p>
+ <p>Le client qui cr&eacute;e la requ&ecirc;te ou le serveur d'origine qui
+ g&eacute;n&egrave;re la r&eacute;ponse doit &ecirc;tre &agrave; m&ecirc;me de d&eacute;terminer si le contenu
+ doit pouvoir &ecirc;tre mis en cache ou non en d&eacute;finissant correctement
+ l'en-t&ecirc;te <code>Cache-Control</code>, et
+ <module>mod_cache</module> sera alors en mesure de satisfaire les
+ souhaits du client ou du serveur de mani&egrave;re appropri&eacute;e.
+ </p>
- <p>Si par contre le contenu servi diff&egrave;re en fonction de la valeur de
- divers en-t&ecirc;tes HTTP, il se peut que l'on puisse le mettre en cache
- intelligemment en utilisant un en-t&ecirc;te "Vary".</p>
+ <p>Les contenus qui varient au cours du temps, ou en fonction de
+ particularit&eacute;s de la requ&ecirc;te non prises en compte par la
+ n&eacute;gociation HTTP ne doivent pas &ecirc;tre mis en cache. Ce type de
+ contenu doit se d&eacute;clarer lui-m&ecirc;me "&agrave; ne pas mettre en cache" via
+ l'en-t&ecirc;te <code>Cache-Control</code>.</p>
+
+ <p>Si le contenu change souvent, suite par exemple &agrave; une dur&eacute;e de
+ fra&icirc;cheur de l'ordre de la minute ou de la seconde, il peut tout
+ de m&ecirc;me &ecirc;tre mis en cache, mais il est alors fortement souhaitable
+ que le serveur d'origine supporte correctement les
+ <strong>requ&ecirc;tes conditionnelles</strong> afin que des r&eacute;ponses
+ compl&egrave;tes ne soient pas syst&eacute;matiquement g&eacute;n&eacute;r&eacute;es.</p>
+
+ <p>Un contenu qui varie en fonction d'en-t&ecirc;tes de requ&ecirc;te fournis
+ par le client peut &ecirc;tre mis en cache, sous r&eacute;serve d'une
+ utilisation appropri&eacute;e de l'en-t&ecirc;te de r&eacute;ponse <code>Vary</code>.</p>
</section>
<section>
<title>Contenu variable et/ou n&eacute;goci&eacute;</title>
- <p>Si <module>mod_cache</module> re&ccedil;oit une r&eacute;ponse contenant un en-t&ecirc;te
- "Vary", lorsqu'un contenu a &eacute;t&eacute; demand&eacute; par un processus d'arri&egrave;re-plan,
- il va s'efforcer de la traiter intelligemment. Si possible,
- <module>mod_cache</module> va d&eacute;tecter les en-t&ecirc;tes attribu&eacute;s dans la
- r&eacute;ponse "Vary" &agrave; l'occasion des futures demandes, et servir une r&eacute;ponse
- correcte &agrave; partir du cache.</p>
+ <p>Lorsque le serveur d'origine est configur&eacute; pour servir des
+ contenus diff&eacute;rents en fonction de la valeur de certains en-t&ecirc;tes
+ de la requ&ecirc;te, par exemple pour servir une ressource en plusieurs
+ langages &agrave; partir d'une seule URL, le m&eacute;canisme de mise en cache
+ d'HTTP permet de mettre en cache plusieurs variantes de la m&ecirc;me
+ page &agrave; partir d'une seule URL.</p>
+
+ <p>Pour y parvenir, le serveur d'origine ajoute un en-t&ecirc;te
+ <code>Vary</code> pour indiquer quels en-t&ecirc;tes doivent &ecirc;tre pris
+ en compte par un cache pour d&eacute;terminer si deux variantes sont
+ diff&eacute;rentes l'une de l'autre.</p>
<p>Si par exemple, une r&eacute;ponse est re&ccedil;ue avec l'en-t&ecirc;te Vary suivant,</p>
@@ -348,188 +454,310 @@ Vary: negotiate,accept-language,accept-charset
<p><module>mod_cache</module> ne servira aux demandeurs que le contenu
mis en cache qui correspond au contenu des en-t&ecirc;tes accept-language et
accept-charset de la requ&ecirc;te originale.</p>
+
+ <p>Plusieurs variantes d'un contenu peuvent &ecirc;tre mises en cache
+ simultan&eacute;ment ; <module>mod_cache</module> utilise l'en-t&ecirc;te
+ <code>Vary</code> et les valeurs correspondantes des en-t&ecirc;tes de
+ la requ&ecirc;te sp&eacute;cifi&eacute;s dans ce dernier pour
+ d&eacute;terminer quelle variante doit &ecirc;tre servie au client.</p>
+
</section>
- </section>
+ <section id="disk">
+ <title>Mise en cache sur disque</title>
- <section id="security">
- <title>Consid&eacute;rations sur la s&eacute;curit&eacute;</title>
+ <p>Le module <module>mod_cache</module> s'appuie sur des
+ impl&eacute;mentations de stockage en arri&egrave;re-plan sp&eacute;cifiques pour g&eacute;rer
+ le cache ; &agrave; ce titre, <module>mod_cache_disk</module> fournit le
+ support de la mise en cache sur disque.</p>
- <section>
- <title>Autorisation et contr&ocirc;le d'acc&egrave;s</title>
+ <p>En g&eacute;n&eacute;ral, le module se configure comme suit :</p>
- <p>Utiliser <module>mod_cache</module> revient sensiblement &agrave; la m&ecirc;me
- chose qu'avoir un mandataire inverse int&eacute;gr&eacute; (reverse-proxy). Les requ&ecirc;tes
- seront servies par le module de mise en cache sauf si ce dernier
- d&eacute;termine qu'un processus d'arri&egrave;re-plan doit &ecirc;tre appel&eacute;. La mise en
- cache de ressources locales modifie consid&eacute;rablement le mod&egrave;le de
- s&eacute;curit&eacute; de httpd.</p>
+ <example>
+CacheRoot /var/cache/apache/<br />
+CacheEnable disk /<br />
+CacheDirLevels 2<br />
+CacheDirLength 1
+ </example>
- <p>Comme le parcours de la hi&eacute;rarchie d'un syst&egrave;me de fichiers pour
- examiner le contenu d'&eacute;ventuels fichiers
- <code>.htaccess</code> serait une op&eacute;ration tr&egrave;s co&ucirc;teuse en ressources,
- annulant partiellement de ce fait l'int&eacute;r&ecirc;t de la mise en cache
- (acc&eacute;l&eacute;rer le traitement des requ&ecirc;tes),
- <module>mod_cache</module> ne se pr&eacute;occupe pas de savoir s'il a
- l'autorisation de servir une entit&eacute; mise en cache. En d'autres termes,
- si <module>mod_cache</module> a mis en cache un certain contenu, ce
- dernier sera servi &agrave; partir du cache tant qu'il ne sera pas arriv&eacute; &agrave;
- expiration.</p>
+ <p>Il est important de savoir que, les fichiers mis en cache &eacute;tant stock&eacute;s
+ localement, la mise en cache par l'interm&eacute;diaire du syst&egrave;me d'exploitation
+ sera en g&eacute;n&eacute;ral aussi appliqu&eacute;e &agrave; leurs acc&egrave;s. Si bien que m&ecirc;me si les
+ fichiers sont stock&eacute;s sur disque, s'il font l'objet d'acc&egrave;s fr&eacute;quents,
+ il est probable que le syst&egrave;me d'exploitation s'appliquera &agrave; ce qu'ils
+ soient servis &agrave; partir de la m&eacute;moire.</p>
- <p>Si par exemple, votre configuration autorise l'acc&egrave;s &agrave; une ressource
- en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
- pas mis en cache. Ceci est possible en utilisant la directive
- <directive module="mod_cache">CacheDisable</directive>, ou le module
- <module>mod_expires</module>. Livr&eacute; &agrave; lui-m&ecirc;me,
- <module>mod_cache</module> - pratiquement comme un mandataire inverse -
- mettrait en cache le contenu lors de son service, et le servirait ensuite
- &agrave; tout client, vers n'importe quelle adresse IP.</p>
</section>
<section>
- <title>Piratages locaux</title>
+ <title>Comprendre le stockage dans le cache</title>
- <p>Etant donn&eacute; que les requ&ecirc;tes des utilisateurs finaux peuvent &ecirc;tre
- servies depuis le cache, ce dernier est une cible potentielle pour ceux
- qui veulent d&eacute;figurer un contenu ou interf&eacute;rer avec lui. Il est important
- de garder &agrave; l'esprit que l'utilisateur sous lequel tourne
- httpd doit
- toujours avoir l'acc&egrave;s en &eacute;criture dans le cache. Ceci est en contraste
- total avec la recommandation usuelle d'interdire &agrave; l'utilisateur sous
- lequel tourne Apache
- l'acc&egrave;s en &eacute;criture &agrave; tout contenu.</p>
+ <p>Pour stocker des entit&eacute;s dans le cache,
+ le module <module>mod_cache_disk</module> cr&eacute;e une empreinte (hash) de 22
+ caract&egrave;res de l'URL qui a fait l'objet d'une requ&ecirc;te. Cette empreinte
+ comprend le nom d'h&ocirc;te, le protocole, le port, le chemin et tout argument
+ de type CGI associ&eacute; &agrave; l'URL, ainsi que les &eacute;l&eacute;ments
+ sp&eacute;cifi&eacute;s dans l'en-t&ecirc;te Vary afin d'&ecirc;tre sur que plusieurs URLs
+ n'interf&egrave;rent pas entre elles.</p>
- <p>Si l'utilisateur sous lequel tourne Apache est compromis,
- par exemple &agrave; cause d'une
- faille de s&eacute;curit&eacute; dans un processus CGI, il est possible que le cache
- fasse l'objet d'une attaque. Il est relativement ais&eacute; d'ins&eacute;rer ou de
- modifier une entit&eacute; dans le cache en utilisant le module
- <module>mod_cache_disk</module>.</p>
+ <p>Chaque position de l'empreinte peut contenir un caract&egrave;re
+ choisi parmi 64 caract&egrave;res diff&eacute;rents, il y a donc
+ 64^22 possibilit&eacute;s pour une empreinte. Par exemple, une URL peut poss&eacute;der
+ l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
+ utilis&eacute;e pour pr&eacute;fixer les noms de fichiers sp&eacute;cifiques &agrave; cette URL &agrave;
+ l'int&eacute;rieur du cache; cependant, elle est tout d'abord plac&eacute;e dans les
+ r&eacute;pertoires du cache selon les directives
+ <directive module="mod_cache_disk">CacheDirLevels</directive> et
+ <directive module="mod_cache_disk">CacheDirLength</directive>.</p>
- <p>Cela repr&eacute;sente un risque relativement &eacute;l&eacute;v&eacute; par rapport aux autres
- types d'attaques qu'il est possible de mener sous l'utilisateur apache.
- Si vous utilisez <module>mod_cache_disk</module>, vous devez garder ceci
- &agrave; l'esprit : effectuez toujours les mises &agrave; jour de
- httpdquand des
- correctifs de s&eacute;curit&eacute; sont annonc&eacute;s et ex&eacute;cutez les processus CGI sous
- un utilisateur autre qu'apache en utilisant
- <a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
+ <p>La directive
+ <directive module="mod_cache_disk">CacheDirLevels</directive>
+ d&eacute;finit le nombre de niveaux de sous-r&eacute;pertoires, et
+ <directive module="mod_cache_disk">CacheDirLength</directive>
+ le nombre de caract&egrave;res composant le nom des sous-r&eacute;pertoires. Dans
+ l'exemple donn&eacute; plus haut, l'empreinte se trouvera &agrave; :
+ <code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
+ <p>Cette technique a pour but principal de r&eacute;duire le nombre de
+ sous-r&eacute;pertoires ou de fichiers contenus dans un r&eacute;pertoire particulier,
+ car le fonctionnement de la plupart des syst&egrave;mes de fichiers est ralenti
+ quand ce nombre augmente. Avec la valeur "1" pour la directive
+ <directive module="mod_cache_disk">CacheDirLength</directive>,
+ il peut y avoir au plus 64 sous-r&eacute;pertoires &agrave; un niveau quelconque.
+ Avec la valeur "2", il peut y en avoir 64 * 64, etc...
+ A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
+ la valeur "1" pour la directive
+ <directive module="mod_cache_disk">CacheDirLength</directive>
+ est recommand&eacute;e.</p>
+
+ <p>Le param&eacute;trage de la directive
+ <directive module="mod_cache_disk">CacheDirLevels</directive>
+ d&eacute;pend du nombre de fichiers que vous pensez stocker dans le cache.
+ Avec une valeur de "2" comme dans l'exemple donn&eacute; plus haut,
+ 4096 sous-r&eacute;pertoires peuvent &ecirc;tre cr&eacute;&eacute;s au total. Avec 1 million de
+ fichiers dans le cache, cela &eacute;quivaut &agrave; environ 245 URLs mises en cache
+ dans chaque r&eacute;pertoire.</p>
+
+ <p>Chaque URL n&eacute;cessite au moins deux fichiers dans le cache. Ce sont en
+ g&eacute;n&eacute;ral un fichier ".header", qui contient des meta-informations &agrave; propos
+ de l'URL, comme la date de son arriv&eacute;e &agrave; expiration,
+ et un fichier ".data" qui est la copie exacte du contenu &agrave; servir.</p>
+
+ <p>Dans le cas d'un contenu n&eacute;goci&eacute; via l'en-t&ecirc;te "Vary", un r&eacute;pertoire
+ ".vary" sera cr&eacute;&eacute; pour l'URL en question. Ce r&eacute;pertoire contiendra de
+ multiples fichiers ".data" correspondant aux diff&eacute;rents contenus
+ n&eacute;goci&eacute;s.</p>
</section>
<section>
- <title>Empoisonnement du cache (Cache Poisoning)</title>
+ <title>Maintenance du cache sur disque</title>
- <p>Si vous utilisez httpd comme serveur mandataire avec mise en cache,
- vous vous exposez aussi &agrave; un &eacute;ventuel "Empoisonnement du
- cache" (Cache poisoning). L'empoisonnement du cache est un terme g&eacute;n&eacute;ral
- pour d&eacute;signer les attaques au cours desquelles l'attaquant fait en sorte
- que le serveur mandataire renvoie &agrave; un contenu incorrect (et souvent
- ind&eacute;sirable) suite &agrave; en provenance du serveur d'arri&egrave;re-plan.
- </p>
+ <p>Le module <module>mod_cache_disk</module> n'effectue aucune
+ r&eacute;gulation de l'espace disque utilis&eacute; par le cache, mais s'il
+ s'arr&ecirc;te en douceur en cas d'erreur disque et se comporte alors
+ comme si le cache n'avait jamais exist&eacute;.</p>
- <p>Par exemple, si les serveur DNS qu'utilise votre syst&egrave;me o&ugrave; tourne
- httpd sont vuln&eacute;rables &agrave; l'empoisonnement du cache des DNS, un attaquant
- pourra contr&ocirc;ler vers o&ugrave; httpd se connecte lorsqu'il demande un contenu
- depuis le serveur d'origine.
- Un autre exemple est constitu&eacute; par les attaques ainsi nomm&eacute;es
- "Dissimulation de requ&ecirc;tes HTTP" (HTTP request-smuggling).</p>
+ <p>Par contre l'utilitaire
+ <a href="programs/htcacheclean.html">htcacheclean</a> fourni avec
+ httpd
+ vous permet de nettoyer le cache p&eacute;riodiquement.
+ D&eacute;terminer la fr&eacute;quence &agrave; laquelle lancer <a
+ href="programs/htcacheclean.html">htcacheclean</a> et la taille souhait&eacute;e
+ pour le cache est une t&acirc;che relativement complexe et il vous faudra de
+ nombreux essais et erreurs pour arriver &agrave; s&eacute;lectionner des valeurs
+ optimales.</p>
- <p>Ce document n'est pas le bon endroit pour une discussion approfondie
- &agrave; propos de la Dissimulation de requ&ecirc;tes HTTP (utilisez plut&ocirc;t votre
- moteur de recherche favori); il est cependant important de savoir qu'il
- est possible d'&eacute;laborer une s&eacute;rie de requ&ecirc;tes, et d'exploiter une
- vuln&eacute;rabilit&eacute; d'un serveur web d'origine de telle fa&ccedil;on que l'attaquant
- puisse contr&ocirc;ler enti&egrave;rement le contenu renvoy&eacute; par le mandataire.</p>
+ <p><a href="programs/htcacheclean.html">htcacheclean</a> op&egrave;re selon deux
+ modes. Il peut s'ex&eacute;cuter comme d&eacute;mon r&eacute;sident, ou &ecirc;tre lanc&eacute;
+ p&eacute;riodiquement par cron. <a
+ href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
+ ou plus pour traiter de tr&egrave;s grands caches (plusieurs dizaines de
+ Gigaoctets) et si vous l'ex&eacute;cutez &agrave; partir de cron, il vous est
+ conseill&eacute; de d&eacute;terminer la dur&eacute;e typique d'un traitement, afin d'&eacute;viter
+ d'ex&eacute;cuter plusieurs instances &agrave; la fois.</p>
+
+ <p>Il est aussi conseill&eacute; d'attribuer un niveau de priorit&eacute; "nice"
+ appropri&eacute; &agrave; htcacheclean de fa&ccedil;on &agrave; ce qu'il n'effectue pas trop
+ d'acc&egrave;s disque pendant le fonctionnement du serveur.</p>
+
+ <p class="figure">
+ <img src="images/caching_fig1.gif" alt="" width="600"
+ height="406" /><br />
+ <a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
+ typique du cache / s&eacute;quence de nettoyage.</p>
+
+ <p>Comme <module>mod_cache_disk</module> ne tient pas compte de l'espace
+ utilis&eacute; dans le cache, vous devez vous assurer que
+ <a href="programs/htcacheclean.html">htcacheclean</a> est configur&eacute; de
+ fa&ccedil;on &agrave; laisser suffisamment d'"espace de croissance"
+ &agrave; la suite d'un nettoyage.</p>
</section>
+
</section>
- <section id="filehandle">
- <title>Mise en cache de la gestion de fichier</title>
+ <section id="socache-caching">
+
+ <title>Mise en cache d'objets partag&eacute;s &agrave; deux &eacute;tats de forme
+ cl&eacute;/valeur</title>
<related>
<modulelist>
- <module>mod_file_cache</module>
+ <module>mod_authn_socache</module>
+ <module>mod_socache_dbm</module>
+ <module>mod_socache_dc</module>
+ <module>mod_socache_memcache</module>
+ <module>mod_socache_shmcb</module>
+ <module>mod_ssl</module>
</modulelist>
- <directivelist>
- <directive module="mod_file_cache">CacheFile</directive>
- </directivelist>
+ <directivelist>
+ <directive module="mod_authn_socache">AuthnCacheSOCache</directive>
+ <directive module="mod_ssl">SSLSessionCache</directive>
+ <directive module="mod_ssl">SSLStaplingCache</directive>
+ </directivelist>
</related>
+
+ <p>Le serveur HTTP Apache fournit un cache d'objets partag&eacute;s de bas
+ niveau pour la mise en cache d'informations comme les sessions SSL
+ ou les donn&eacute;es d'authentification dans l'interface <a
+ href="socache.html">socache</a>.</p>
+
+ <p>Pour chaque impl&eacute;mentation un module suppl&eacute;mentaire est fourni
+ qui offre les services d'arri&egrave;re-plan suivants :</p>
+
+ <dl>
+ <dt><module>mod_socache_dbm</module></dt>
+ <dd>Cache d'objets partag&eacute;s bas&eacute; sur DBM.</dd>
+ <dt><module>mod_socache_dc</module></dt>
+ <dd>Cache d'objets partag&eacute;s bas&eacute; sur Distcache.</dd>
+ <dt><module>mod_socache_memcache</module></dt>
+ <dd>Cache d'objets partag&eacute;s bas&eacute; sur Memcache.</dd>
+ <dt><module>mod_socache_shmcb</module></dt>
+ <dd>Cache d'objets partag&eacute;s bas&eacute; sur la m&eacute;moire partag&eacute;e.</dd>
+ </dl>
+
+ <section id="mod_authn_socache-caching">
+ <title>Mise en cache des donn&eacute;es d'authentification</title>
+
+ <related>
+ <modulelist>
+ <module>mod_authn_socache</module>
+ </modulelist>
+ <directivelist>
+ <directive module="mod_authn_socache">AuthnCacheSOCache</directive>
+ </directivelist>
+ </related>
+
+ <p>Le module <module>mod_authn_socache</module> permet la mise en
+ cache des donn&eacute;es issues d'une authentification, diminuant ainsi
+ la charge des serveurs d'authentification en arri&egrave;re-plan.</p>
- <p>Le fait d'ouvrir un fichier peut en lui-m&ecirc;me introduire un d&eacute;lai,
- en particulier dans les syst&egrave;mes de fichiers r&eacute;partis
- sur le r&eacute;seau. httpd
- peut s'affranchir de ce d&eacute;lai en maintenant
- un cache des descripteurs de fichiers
- ouverts pour ce qui concerne les fichiers souvent
- acc&eacute;d&eacute;s. httpd propose
- actuellement une impl&eacute;mentation de mise en cache de la
- gestion de fichier.</p>
-
- <section>
- <title>Directive CacheFile</title>
+ </section>
- <p>La forme la plus &eacute;l&eacute;mentaire de mise en cache que
- propose httpd est
- fournie par le module <module>mod_file_cache</module>.
- Plut&ocirc;t que de mettre en cache le contenu des fichiers, ce cache maintient
- une table des descripteurs de fichiers ouverts. Les fichiers &agrave; mettre en
- cache de cette mani&egrave;re sont sp&eacute;cifi&eacute;s dans le fichier de configuration
- en utilisant la directive
- <directive module="mod_file_cache">CacheFile</directive>.</p>
+ <section id="mod_ssl-caching">
+ <title>Mise en cache des sessions SSL</title>
- <p>La directive
- <directive module="mod_file_cache">CacheFile</directive> demande
- &agrave; httpd
- d'ouvrir le fichier lors de son d&eacute;marrage et de r&eacute;utiliser le descripteur
- de fichier &eacute;labor&eacute; &agrave; cette occasion pour tous les
- acc&egrave;s ult&eacute;rieurs &agrave; ce fichier.</p>
+ <related>
+ <modulelist>
+ <module>mod_ssl</module>
+ </modulelist>
+ <directivelist>
+ <directive module="mod_ssl">SSLSessionCache</directive>
+ <directive module="mod_ssl">SSLStaplingCache</directive>
+ </directivelist>
+ </related>
- <example>
- CacheFile /usr/local/apache2/htdocs/index.html
- </example>
+ <p>Le module <module>mod_ssl</module> utilise l'interface
+ <code>socache</code> pour fournir un cache de session et un cache
+ de base.</p>
- <p>Si vous avez l'intention de mettre en cache un grand nombre de
- fichiers de cette mani&egrave;re, vous devez vous assurer que le nombre maximum
- de fichiers ouverts par votre syst&egrave;me d'exploitation est correctement
- d&eacute;fini.</p>
-
- <p>Bien que l'utilisation de la directive
- <directive module="mod_file_cache">CacheFile</directive>
- n'entra&icirc;ne pas la mise en cache du contenu du fichier, cela ne signifie
- pas qu'en cas de modification du fichier pendant
- l'ex&eacute;cution de httpd,
- ces changements seront pris en compte. Le fichier sera toujours servi
- dans l'&eacute;tat o&ugrave; il &eacute;tait quand httpd a d&eacute;marr&eacute;.</p>
-
- <p>Si le fichier est supprim&eacute; pendant l'ex&eacute;cution de
- httpd, ce dernier
- continuera &agrave; maintenir un descripteur de fichier ouvert et &agrave; servir le
- fichier dans l'&eacute;tat o&ugrave; il &eacute;tait quand httpd a d&eacute;marr&eacute;. Cela signifie
- aussi habituellement que malgr&eacute; le fait que le fichier ait &eacute;t&eacute; supprim&eacute;,
- et ne soit
- plus accessible par le syst&egrave;me de fichiers, l'espace lib&eacute;r&eacute; ne sera
- restitu&eacute; qu'&agrave; l'arr&ecirc;t de httpd quand le
- descripteur de fichier sera ferm&eacute;.</p>
</section>
-
</section>
- <section id="inmemory">
- <title>Mise en cache en m&eacute;moire</title>
+ <section id="file-caching">
+
+ <title>Mise en cache &agrave; base de fichiers sp&eacute;cialis&eacute;s</title>
- <related>
+ <related>
<modulelist>
<module>mod_file_cache</module>
</modulelist>
<directivelist>
- <directive module="mod_cache">CacheEnable</directive>
- <directive module="mod_cache">CacheDisable</directive>
+ <directive module="mod_file_cache">CacheFile</directive>
<directive module="mod_file_cache">MMapFile</directive>
</directivelist>
</related>
+ <p>Sur les plateformes o&ugrave; le syst&egrave;me de fichiers peut &ecirc;tre lent, ou
+ lorsque les descripteurs de fichiers sont gourmands en ressources,
+ il est possible de pr&eacute;charger des fichiers en m&eacute;moire au d&eacute;marrage
+ du serveur.</p>
+
+ <p>Sur les syst&egrave;mes o&ugrave; l'ouverture des fichiers est lente, il est
+ possible d'ouvrir le fichier au d&eacute;marrage du serveur et de mettre en
+ cache le descripteur de fichier. Ces options peuvent vous aider sur
+ les syst&egrave;mes o&ugrave; l'acc&egrave;s aux fichiers statiques est lent.</p>
+
+ <section id="filehandle">
+ <title>Mise en cache des descripteurs de fichier</title>
+
+ <p>Le processus d'ouverture d'un fichier peut &ecirc;tre en soi une
+ source de ralentissement, en particulier sur les syst&egrave;mes de
+ fichiers sur le r&eacute;seau. httpd permet d'&eacute;viter ce ralentissement en
+ maintenant un cache des descripteurs de fichiers ouverts pour les
+ fichiers souvent servis. Actuellement, httpd fournit une seule
+ impl&eacute;mentation de mise en cache des descripteurs de fichiers.</p>
+
+ <section>
+ <title>CacheFile</title>
+
+ <p>La forme la plus basique de mise en cache que propose httpd
+ est la mise en cache des descripteurs de fichiers fournie par le
+ module <module>mod_file_cache</module>. Plut&ocirc;t que de mettre en
+ cache le contenu des fichiers, ce cache maintient une table des
+ descripteurs de fichiers ouverts. Les fichiers devant faire
+ l'objet d'une mise en cache de ce type sont sp&eacute;cifi&eacute;s dans le
+ fichier de configuration via la directive <directive
+ module="mod_file_cache">CacheFile</directive>.</p>
+
+ <p>La directive <directive
+ module="mod_file_cache">CacheFile</directive> informe httpd
+ qu'il doit ouvrir le fichier lors de son d&eacute;marrage et qu'il doit
+ r&eacute;utiliser le descripteur de fichier mis en cache pour tous les
+ acc&egrave;s futurs &agrave; ce fichier.</p>
+
+ <example>
+ CacheFile /usr/local/apache2/htdocs/index.html
+ </example>
+
+ <p>Si vous d&eacute;sirez mettre en cache un grand nombre de fichiers
+ de cette mani&egrave;re, vous devez vous assurer que le nombre maximal
+ de fichiers ouverts pour votre syst&egrave;me d'exploitation est d&eacute;fini
+ &agrave; une valeur suffisante.</p>
+
+ <p>Bien que l'utilisation de la directive <directive
+ module="mod_file_cache">CacheFile</directive> n'entra&icirc;ne pas de
+ mise en cache du contenu du fichier proprement dit, elle
+ implique que si le fichier est modifi&eacute; pendant l'ex&eacute;cution du
+ serveur, ces modifications ne seront pas prises en compte. Le
+ fichier sera toujours servi dans l'&eacute;tat o&ugrave; il se trouvait au
+ moment du d&eacute;marrage du serveur.</p>
+
+ <p>Si le fichier est supprim&eacute; pendant l'ex&eacute;cution du serveur, ce
+ dernier conservera le descripteur de fichier ouvert associ&eacute; et
+ servira le fichier dans l'&eacute;tat o&ugrave; il se trouvait au
+ moment du d&eacute;marrage du serveur. Cela signifie aussi que m&ecirc;me si
+ le fichier a &eacute;t&eacute; supprim&eacute;, et n'appara&icirc;t donc plus dans le
+ syst&egrave;me de fichiers, l'espace disque lib&eacute;r&eacute; ne sera disponible
+ qu'une fois le serveur httpd arr&ecirc;t&eacute; et donc le descripteur de
+ fichier ferm&eacute;.</p>
+ </section>
+
+ </section>
+
+ <section id="inmemory">
+ <title>In-Memory Caching</title>
+
<p>Servir un contenu directement depuis la m&eacute;moire syst&egrave;me est
universellement reconnu comme la m&eacute;thode la plus rapide. Lire des fichiers
depuis un contr&ocirc;leur de disque ou pire, depuis un r&eacute;seau distant est plus
@@ -549,7 +777,7 @@ Vary: negotiate,accept-language,accept-charset
Sinon le syst&egrave;me sera contraint d'utiliser le swap, ce qui d&eacute;gradera
sensiblement les performances.</p>
- <section>
+ <section>
<title>Mise en cache par l'interm&eacute;diaire du syst&egrave;me d'exploitation</title>
<p>Dans la plupart des syst&egrave;mes d'exploitation modernes, c'est le noyau
@@ -560,7 +788,7 @@ Vary: negotiate,accept-language,accept-charset
temps n&eacute;cessaire &agrave; la premi&egrave;re lecture d'un fichier et le temps
n&eacute;cessaire &agrave; sa deuxi&egrave;me lecture;</p>
- <example><pre>
+ <example><pre>
colm@coroebus:~$ time cat testfile &gt; /dev/null
real 0m0.065s
user 0m0.000s
@@ -569,7 +797,7 @@ colm@coroebus:~$ time cat testfile &gt; /dev/null
real 0m0.003s
user 0m0.003s
sys 0m0.000s</pre>
- </example>
+ </example>
<p>M&ecirc;me pour ce petit fichier, il y a une grande diff&eacute;rence entre les
temps n&eacute;cessaires pour lire le fichier. Ceci est du au fait que le
@@ -588,7 +816,7 @@ sys 0m0.000s</pre>
avantage par rapport &agrave; la mise en cache en m&eacute;moire
de httpd qui n'a
aucune possibilit&eacute; de savoir si un fichier a &eacute;t&eacute; modifi&eacute;.</p>
- </section>
+ </section>
<p>En d&eacute;pit des performances et des avantages de la mise en cache
automatique par le syst&egrave;me d'exploitation, la mise en cache en m&eacute;moire
@@ -606,9 +834,9 @@ sys 0m0.000s</pre>
utilisera le contenu charg&eacute; en m&eacute;moire pour satisfaire ult&eacute;rieurement
toutes les demandes d'acc&egrave;s &agrave; ce fichier.</p>
- <example>
- MMapFile /usr/local/apache2/htdocs/index.html
- </example>
+ <example>
+ MMapFile /usr/local/apache2/htdocs/index.html
+ </example>
<p>Comme dans le cas de la directive
<directive module="mod_file_cache">CacheFile</directive>, toute
@@ -622,144 +850,138 @@ sys 0m0.000s</pre>
sa propre r&eacute;plique de la m&eacute;moire allou&eacute;e, il est donc d'une importance
critique de s'assurer que les fichiers charg&eacute;s ne sont pas d'une taille
trop importante afin d'&eacute;pargner au syst&egrave;me l'utilisation du swap.</p>
+ </section>
</section>
-
</section>
- <section id="disk">
- <title>Mise en cache sur disque</title>
-
- <related>
- <modulelist>
- <module>mod_cache_disk</module>
- </modulelist>
- <directivelist>
- <directive module="mod_cache">CacheEnable</directive>
- <directive module="mod_cache">CacheDisable</directive>
- </directivelist>
- </related>
-
- <p>Le module <module>mod_cache_disk</module> fournit un m&eacute;canisme de mise
- en cache sur disque au module <module>mod_cache</module>. Cette mise en cache est
- intelligente et le contenu ne sera servi qu'&agrave; partir du cache tant qu'il
- sera consid&eacute;r&eacute; comme valide.</p>
+ <section id="security">
+ <title>Consid&eacute;rations sur la s&eacute;curit&eacute;</title>
- <p>Typiquement, le module sera configur&eacute; comme suit :</p>
+ <section>
+ <title>Autorisation et contr&ocirc;le d'acc&egrave;s</title>
- <example>
-CacheRoot /var/cache/apache/<br />
-CacheEnable disk /<br />
-CacheDirLevels 2<br />
-CacheDirLength 1
- </example>
+ <p>Utiliser <module>mod_cache</module> revient sensiblement &agrave; la m&ecirc;me
+ chose qu'avoir un mandataire inverse int&eacute;gr&eacute; (reverse-proxy). Les requ&ecirc;tes
+ seront servies par le module de mise en cache sauf si ce dernier
+ d&eacute;termine qu'un processus d'arri&egrave;re-plan doit &ecirc;tre appel&eacute;. La mise en
+ cache de ressources locales modifie consid&eacute;rablement le mod&egrave;le de
+ s&eacute;curit&eacute; de httpd.</p>
- <p>Il est important de savoir que, les fichiers mis en cache &eacute;tant stock&eacute;s
- localement, la mise en cache par l'interm&eacute;diaire du syst&egrave;me d'exploitation
- sera en g&eacute;n&eacute;ral aussi appliqu&eacute;e &agrave; leurs acc&egrave;s. Si bien que m&ecirc;me si les
- fichiers sont stock&eacute;s sur disque, s'il font l'objet d'acc&egrave;s fr&eacute;quents,
- il est probable que le syst&egrave;me d'exploitation s'appliquera &agrave; ce qu'ils
- soient servis &agrave; partir de la m&eacute;moire.</p>
+ <p>Comme le parcours de la hi&eacute;rarchie d'un syst&egrave;me de fichiers pour
+ examiner le contenu d'&eacute;ventuels fichiers
+ <code>.htaccess</code> serait une op&eacute;ration tr&egrave;s co&ucirc;teuse en ressources,
+ annulant partiellement de ce fait l'int&eacute;r&ecirc;t de la mise en cache
+ (acc&eacute;l&eacute;rer le traitement des requ&ecirc;tes),
+ <module>mod_cache</module> ne se pr&eacute;occupe pas de savoir s'il a
+ l'autorisation de servir une entit&eacute; mise en cache. En d'autres termes,
+ si <module>mod_cache</module> a mis en cache un certain contenu, ce
+ dernier sera servi &agrave; partir du cache tant qu'il ne sera pas arriv&eacute; &agrave;
+ expiration.</p>
- <section>
- <title>Comprendre le stockage dans le cache</title>
+ <p>Si par exemple, votre configuration autorise l'acc&egrave;s &agrave; une ressource
+ en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
+ pas mis en cache. Ceci est possible en utilisant la directive
+ <directive module="mod_cache">CacheDisable</directive>, ou le module
+ <module>mod_expires</module>. Livr&eacute; &agrave; lui-m&ecirc;me,
+ <module>mod_cache</module> - pratiquement comme un mandataire inverse -
+ mettrait en cache le contenu lors de son service, et le servirait ensuite
+ &agrave; tout client, vers n'importe quelle adresse IP.</p>
- <p>Pour stocker des entit&eacute;s dans le cache,
- le module <module>mod_cache_disk</module> cr&eacute;e une empreinte (hash) de 22
- caract&egrave;res de l'URL qui a fait l'objet d'une requ&ecirc;te. Cette empreinte
- comprend le nom d'h&ocirc;te, le protocole, le port, le chemin et tout argument
- de type CGI associ&eacute; &agrave; l'URL, afin d'&ecirc;tre sur que plusieurs URLs
- n'interf&egrave;rent pas entre elles.</p>
+ <p>Lorsque la directive <directive
+ module="mod_cache">CacheQuickHandler</directive> est d&eacute;finie &agrave;
+ <code>Off</code>, toutes les phases du traitement de la requ&ecirc;te
+ sont ex&eacute;cut&eacute;es et le mod&egrave;le de s&eacute;curit&eacute; reste le m&ecirc;me.</p>
- <p>Chaque position de l'empreinte peut contenir un caract&egrave;re
- choisi parmi 64 caract&egrave;res diff&eacute;rents, il y a donc
- 64^22 possibilit&eacute;s pour une empreinte. Par exemple, une URL peut poss&eacute;der
- l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
- utilis&eacute;e pour pr&eacute;fixer les noms de fichiers sp&eacute;cifiques &agrave; cette URL &agrave;
- l'int&eacute;rieur du cache; cependant, elle est tout d'abord plac&eacute;e dans les
- r&eacute;pertoires du cache selon les directives
- <directive module="mod_cache_disk">CacheDirLevels</directive> et
- <directive module="mod_cache_disk">CacheDirLength</directive>.</p>
+ </section>
- <p>La directive
- <directive module="mod_cache_disk">CacheDirLevels</directive>
- d&eacute;finit le nombre de niveaux de sous-r&eacute;pertoires, et
- <directive module="mod_cache_disk">CacheDirLength</directive>
- le nombre de caract&egrave;res composant le nom des sous-r&eacute;pertoires. Dans
- l'exemple donn&eacute; plus haut, l'empreinte se trouvera &agrave; :
- <code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
+ <section>
+ <title>Piratages locaux</title>
- <p>Cette technique a pour but principal de r&eacute;duire le nombre de
- sous-r&eacute;pertoires ou de fichiers contenus dans un r&eacute;pertoire particulier,
- car le fonctionnement de la plupart des syst&egrave;mes de fichiers est ralenti
- quand ce nombre augmente. Avec la valeur "1" pour la directive
- <directive module="mod_cache_disk">CacheDirLength</directive>,
- il peut y avoir au plus 64 sous-r&eacute;pertoires &agrave; un niveau quelconque.
- Avec la valeur "2", il peut y en avoir 64 * 64, etc...
- A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
- la valeur "1" pour la directive
- <directive module="mod_cache_disk">CacheDirLength</directive>
- est recommand&eacute;e.</p>
+ <p>Etant donn&eacute; que les requ&ecirc;tes des utilisateurs finaux peuvent &ecirc;tre
+ servies depuis le cache, ce dernier est une cible potentielle pour ceux
+ qui veulent d&eacute;figurer un contenu ou interf&eacute;rer avec lui. Il est important
+ de garder &agrave; l'esprit que l'utilisateur sous lequel tourne
+ httpd doit
+ toujours avoir l'acc&egrave;s en &eacute;criture dans le cache. Ceci est en contraste
+ total avec la recommandation usuelle d'interdire &agrave; l'utilisateur sous
+ lequel tourne Apache
+ l'acc&egrave;s en &eacute;criture &agrave; tout contenu.</p>
- <p>Le param&eacute;trage de la directive
- <directive module="mod_cache_disk">CacheDirLevels</directive>
- d&eacute;pend du nombre de fichiers que vous pensez stocker dans le cache.
- Avec une valeur de "2" comme dans l'exemple donn&eacute; plus haut,
- 4096 sous-r&eacute;pertoires peuvent &ecirc;tre cr&eacute;&eacute;s au total. Avec 1 million de
- fichiers dans le cache, cela &eacute;quivaut &agrave; environ 245 URLs mises en cache
- dans chaque r&eacute;pertoire.</p>
+ <p>Si l'utilisateur sous lequel tourne Apache est compromis,
+ par exemple &agrave; cause d'une
+ faille de s&eacute;curit&eacute; dans un processus CGI, il est possible que le cache
+ fasse l'objet d'une attaque. Il est relativement ais&eacute; d'ins&eacute;rer ou de
+ modifier une entit&eacute; dans le cache en utilisant le module
+ <module>mod_cache_disk</module>.</p>
- <p>Chaque URL n&eacute;cessite au moins deux fichiers dans le cache. Ce sont en
- g&eacute;n&eacute;ral un fichier ".header", qui contient des meta-informations &agrave; propos
- de l'URL, comme la date de son arriv&eacute;e &agrave; expiration,
- et un fichier ".data" qui est la copie exacte du contenu &agrave; servir.</p>
+ <p>Cela repr&eacute;sente un risque relativement &eacute;l&eacute;v&eacute; par rapport aux autres
+ types d'attaques qu'il est possible de mener sous l'utilisateur apache.
+ Si vous utilisez <module>mod_cache_disk</module>, vous devez garder ceci
+ &agrave; l'esprit : effectuez toujours les mises &agrave; jour de
+ httpdquand des
+ correctifs de s&eacute;curit&eacute; sont annonc&eacute;s et ex&eacute;cutez les processus CGI sous
+ un utilisateur autre qu'apache en utilisant
+ <a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
- <p>Dans le cas d'un contenu n&eacute;goci&eacute; via l'en-t&ecirc;te "Vary", un r&eacute;pertoire
- ".vary" sera cr&eacute;&eacute; pour l'URL en question. Ce r&eacute;pertoire contiendra de
- multiples fichiers ".data" correspondant aux diff&eacute;rents contenus
- n&eacute;goci&eacute;s.</p>
</section>
<section>
- <title>Maintenance du cache sur disque</title>
-
- <p>Bien que le module <module>mod_cache_disk</module> supprime un contenu
- du cache lorsqu'il est arriv&eacute; &agrave; expiration, il ne maintient aucune
- information &agrave; propos de la taille totale du cache ou de l'espace restant
- disponible.</p>
-
- <p>Par contre l'utilitaire
- <a href="programs/htcacheclean.html">htcacheclean</a> fourni avec
- httpd
- vous permet, comme son nom l'indique, de nettoyer le cache p&eacute;riodiquement.
- D&eacute;terminer la fr&eacute;quence &agrave; laquelle lancer <a
- href="programs/htcacheclean.html">htcacheclean</a> et la taille souhait&eacute;e
- pour le cache est une t&acirc;che relativement complexe et il vous faudra de
- nombreux essais et erreurs pour arriver &agrave; s&eacute;lectionner des valeurs
- optimales.</p>
+ <title>Empoisonnement du cache (Cache Poisoning)</title>
- <p><a href="programs/htcacheclean.html">htcacheclean</a> op&egrave;re selon deux
- modes. Il peut s'ex&eacute;cuter comme d&eacute;mon r&eacute;sident, ou &ecirc;tre lanc&eacute;
- p&eacute;riodiquement par cron. <a
- href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
- ou plus pour traiter de tr&egrave;s grands caches (plusieurs dizaines de
- Gigaoctets) et si vous l'ex&eacute;cutez &agrave; partir de cron, il vous est
- conseill&eacute; de d&eacute;terminer la dur&eacute;e typique d'un traitement, afin d'&eacute;viter
- d'ex&eacute;cuter plusieurs instances &agrave; la fois.</p>
+ <p>Si vous utilisez httpd comme serveur mandataire avec mise en cache,
+ vous vous exposez aussi &agrave; un &eacute;ventuel "Empoisonnement du
+ cache" (Cache poisoning). L'empoisonnement du cache est un terme g&eacute;n&eacute;ral
+ pour d&eacute;signer les attaques au cours desquelles l'attaquant fait en sorte
+ que le serveur mandataire renvoie &agrave; un contenu incorrect (et souvent
+ ind&eacute;sirable) suite &agrave; en provenance du serveur d'arri&egrave;re-plan.
+ </p>
- <p class="figure">
- <img src="images/caching_fig1.gif" alt="" width="600"
- height="406" /><br />
- <a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
- typique du cache / s&eacute;quence de nettoyage.</p>
+ <p>Par exemple, si les serveur DNS qu'utilise votre syst&egrave;me o&ugrave; tourne
+ httpd sont vuln&eacute;rables &agrave; l'empoisonnement du cache des DNS, un attaquant
+ pourra contr&ocirc;ler vers o&ugrave; httpd se connecte lorsqu'il demande un contenu
+ depuis le serveur d'origine.
+ Un autre exemple est constitu&eacute; par les attaques ainsi nomm&eacute;es
+ "Dissimulation de requ&ecirc;tes HTTP" (HTTP request-smuggling).</p>
- <p>Comme <module>mod_cache_disk</module> ne tient pas compte de l'espace
- utilis&eacute; dans le cache, vous devez vous assurer que
- <a href="programs/htcacheclean.html">htcacheclean</a> est configur&eacute; de
- fa&ccedil;on &agrave; laisser suffisamment d'"espace de croissance"
- &agrave; la suite d'un nettoyage.</p>
+ <p>Ce document n'est pas le bon endroit pour une discussion approfondie
+ &agrave; propos de la Dissimulation de requ&ecirc;tes HTTP (utilisez plut&ocirc;t votre
+ moteur de recherche favori); il est cependant important de savoir qu'il
+ est possible d'&eacute;laborer une s&eacute;rie de requ&ecirc;tes, et d'exploiter une
+ vuln&eacute;rabilit&eacute; d'un serveur web d'origine de telle fa&ccedil;on que l'attaquant
+ puisse contr&ocirc;ler enti&egrave;rement le contenu renvoy&eacute; par le mandataire.</p>
</section>
+ <section>
+ <title>D&eacute;ni de Service / Cachebusting</title>
+
+ <p>Le m&eacute;canisme utilis&eacute; via l'en-t&ecirc;te Vary permet de mettre en
+ cache simultan&eacute;ment plusieurs variantes d'une ressource avec la
+ m&ecirc;me URL. Le cache s&eacute;lectionne la variante correcte &agrave; envoyer au
+ client en fonction des valeurs d'en-t&ecirc;te fournies par ce dernier.
+ Ce m&eacute;canisme peut devenir un probl&egrave;me lorsqu'on tente d'appliquer
+ le m&eacute;canisme des variantes &agrave; un en-t&ecirc;te connu pour pouvoir
+ poss&eacute;der un grand nombre de valeurs
+ possibles en utilisation normal, comme par exemple l'en-t&ecirc;te
+ <code>User-Agent</code>. En fonction de la popularit&eacute; du site web,
+ des milliers ou m&ecirc;me des millions d'entr&eacute;es de cache dupliqu&eacute;es
+ peuvent &ecirc;tre cr&eacute;&eacute;es pour la m&ecirc;me URL, submergeant les autres
+ entr&eacute;es du cache.</p>
+
+ <p>Dans d'autres cas, il peut &ecirc;tre n&eacute;cessaire de modifier l'URL
+ d'une ressource particuli&egrave;re &agrave; chaque requ&ecirc;te, en g&eacute;n&eacute;ral en lui
+ ajoutant une cha&icirc;ne "cachebuster". Si ce contenu est d&eacute;clar&eacute; comme
+ pouvant &ecirc;tre mis en cache par un serveur avec une dur&eacute;e de
+ fra&icirc;cheur significative, ces entr&eacute;es peuvent submerger les entr&eacute;es
+ l&eacute;gitimes du cache. Alors que <module>mod_cache</module> fournit
+ une directive <directive
+ module="mod_cache">CacheIgnoreURLSessionIdentifiers</directive>,
+ cette derni&egrave;re doit &ecirc;tre utilis&eacute;e avec prudence pour s'assurer que
+ les caches du navigateur ou du mandataire le plus proche
+ (downstream proxy) ne sont pas victimes du m&ecirc;me probl&egrave;me de D&eacute;ni de
+ service.</p>
+ </section>
</section>
+
</manualpage>