1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
|
<?xml version="1.0" encoding="ISO-8859-1" ?>
<!DOCTYPE manualpage SYSTEM "style/manualpage.dtd">
<?xml-stylesheet type="text/xsl" href="style/manual.fr.xsl"?>
<!-- French translation : Lucien GENTIS -->
<!-- Reviewed by : Vincent Deffontaines -->
<!-- English Revision : 1058639 -->
<!--
Licensed to the Apache Software Foundation (ASF) under one or more
contributor license agreements. See the NOTICE file distributed with
this work for additional information regarding copyright ownership.
The ASF licenses this file to You under the Apache License, Version 2.0
(the "License"); you may not use this file except in compliance with
the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
-->
<manualpage metafile="caching.xml.meta">
<title>Guide de la mise en cache</title>
<summary>
<p>Ce document complète la documentation de référence des modules
<module>mod_cache</module>, <module>mod_cache_disk</module>,
<module>mod_file_cache</module> et du programme <a
href="programs/htcacheclean.html">htcacheclean</a>.
Il décrit l'utilisation des fonctionnalités de mise en
cache du serveur HTTP Apache
pour accélérer les services web et proxy, tout en évitant les problèmes
courants et les erreurs de configuration.</p>
</summary>
<section id="introduction">
<title>Introduction</title>
<p>Depuis la version 2.2 du serveur HTTP Apache, les modules
<module>mod_cache</module>
et <module>mod_file_cache</module> ne sont plus jugés expérimentaux
et on considère qu'ils peuvent être utilisés en production. Ces
architectures de mise en cache constituent un puissant concept
d'accélération de la gestion HTTP, tant comme serveur web originel
que comme mandataire.</p>
<p>Le module <module>mod_cache</module> et son module de soutien
<module>mod_cache_disk</module>
permettent une mise en cache intelligente du point de vue HTTP.
Le contenu proprement dit est stocké dans le cache,
et mod_cache tente d'honorer tous les en-têtes HTTP et les options
qui définissent la possibilité de mise en cache du contenu. Il gère non
seulement le contenu local, mais aussi le contenu mandaté.
<module>mod_cache</module>
est conçu pour des configurations de mise en cache simples ou complexes,
dans lesquels vous traitez de contenu mandaté, de contenu local dynamique
ou avez besoin d'accélérer l'accès à des fichiers locaux qui sont modifiés
au cours du temps.</p>
<p>Le module <module>mod_file_cache</module> quant à lui, constitue une
forme de mise en cache plus basique, mais quelques fois intéressante.
Plutôt que de gérer la complexité de s'assurer de manière active de la
possibilité de mise en cache d'URLs,
<module>mod_file_cache</module> fournit des méthodes pour la gestion
et l'édition de fichiers en mémoire afin de maintenir un cache de fichiers
dans l'état où ils étaient la dernière
fois qu'httpd a démarré.
En tant que tel, <module>mod_file_cache</module> a été conçu pour améliorer
le temps d'accès à des fichiers locaux statiques qui ne sont modifiés
que rarement.</p>
<p>Etant donné que <module>mod_file_cache</module> constitue une
implémentation de mise en cache relativement simple, mises à part les
sections spécifiques sur les directives <directive
module="mod_file_cache">CacheFile</directive> et <directive
module="mod_file_cache">MMapFile</directive>, les explications fournies
dans ce guide concernent l'architecture de mise en cache du
module <module>mod_cache</module>.</p>
<p>Pour tirer parti efficacement de ce document, les bases de HTTP doivent
vous être familières, et vous devez avoir lu les sections
<a href="urlmapping.html">Mise en correspondance des
URLs avec le système de fichiers</a> et
<a href="content-negotiation.html">Négociation sur le contenu</a>
du guide de l'utilisateur.</p>
</section>
<section id="overview">
<title>Vue d'ensemble de la mise en cache</title>
<related>
<modulelist>
<module>mod_cache</module>
<module>mod_cache_disk</module>
<module>mod_file_cache</module>
</modulelist>
<directivelist>
<directive module="mod_cache">CacheEnable</directive>
<directive module="mod_cache">CacheDisable</directive>
<directive module="mod_file_cache">CacheFile</directive>
<directive module="mod_file_cache">MMapFile</directive>
<directive module="core">UseCanonicalName</directive>
<directive module="mod_negotiation">CacheNegotiatedDocs</directive>
</directivelist>
</related>
<p><module>mod_cache</module> peut faire intervenir deux phases
principales pendant la durée de vie d'une requête.
En premier lieu, <module>mod_cache</module>
est un module de mise en correspondance d'URLs, ce qui signifie que si
une URL a été mise en cache, et que la version du cache de cette URL n'est
pas arrivée à expiration, la requête sera traitée directement par
<module>mod_cache</module>.</p>
<p>Ceci entraîne que toutes autres actions qui se dérouleraient normalement
au cours du processus de traitement d'une requête -- par exemple un
traitement effectué par <module>mod_proxy</module>, ou
<module>mod_rewrite</module> --
ne seront pas effectuées. Mais c'est justement l'intérêt
de la mise en cache préalable du contenu.</p>
<p>Si l'URL ne se trouve pas dans le cache, <module>mod_cache</module>
va ajouter un <a href="filter.html">filtre</a> au traitement de la requête.
Une fois le contenu localisé par httpd selon la conception courante, le
filtre sera exécuté en même temps que le contenu sera servi.
S'il est déterminé que le contenu peut être mis en cache,
il sera sauvegardé dans le cache pour une utilisation future.</p>
<p>Si l'URL se trouve dans le cache, mais est arrivée à expiration,
le filtre est quand-même ajouté, mais <module>mod_cache</module> va créer
une requête conditionnelle en arrière-plan, pour déterminer si la version
du cache est encore à jour. Si la version du cache est encore à jour, ses
meta-informations seront mises à jour et la requête sera servie à partir du
cache. Si la version du contenu n'est plus à jour, elle sera supprimée et le
filtre va sauvegarder le contenu mis à jour dans le cache
au moment où il sera servi.</p>
<section>
<title>Amélioration du taux de présence dans le cache</title>
<p>Lors de la mise en cache de contenu généré localement, le
positionnement de la directive
<directive module="core">UseCanonicalName</directive> à
<code>On</code> peut améliorer de manière spectaculaire le taux de
présence dans le cache. Ceci est du au fait que le nom d'hôte de l'hôte
virtuel qui sert le contenu constitue une partie de la clé de cache.
Avec <directive module="core">UseCanonicalName</directive> positionnée
à <code>On</code>,
les hôtes virtuels possédant plusieurs noms de serveur ou alias ne
généreront pas d'entités de cache différentes, et le contenu sera mis en
cache en faisant référence au nom d'hôte canonique.</p>
<p>Les documents mis en cache ne seront servis qu'en réponse à des
requêtes de type URL, car la mise en cache est effectuée lors de la phase
de traduction de l'URL en nom de fichier.
En général, cela n'a que peu d'effet, à moins que vous n'utilisiez les
<a href="howto/ssi.html">Inclusions Côté Serveur (SSI)</a>;</p>
<example>
<!-- L'inclusion suivante peut être mise en cache --><br />
<!--#include virtual="/footer.html" --><br />
<br />
<!-- L'inclusion suivante ne peut pas être mise en cache --><br />
<!--#include file="/path/to/footer.html" --> <br />
</example>
<p>Si vous utilisez les SSI, et voulez bénéficier de la vitesse de
service depuis le cache, vous devez utiliser des inclusions de type
<code>virtual</code>.</p>
</section>
<section>
<title>Périodes d'expiration</title>
<p>La période d'expiration par défaut pour les entités du cache est
d'une heure; elle peut cependant être facilement modifiée à l'aide de
la directive <directive
module="mod_cache">CacheDefaultExpire</directive>. Cette valeur par
défaut n'est utilisée que lorsque la source originale du contenu ne
précise pas de période d'expiration ou d'heure de dernière
modification.</p>
<p>Si une réponse ne contient pas d'en-tête <code>Expires</code> mais
inclut un en-tête <code>Last-Modified</code>, <module>mod_cache</module>
peut déduire une période d'expiration en se basant sur la valeur de la
directive <directive
module="mod_cache">CacheLastModifiedFactor</directive>.</p>
<p>La période d'expiration des contenus locaux peut être ajustée finement
en utilisant le module <module>mod_expires</module>.</p>
<p>On peut aussi contrôler la période d'expiration maximale en utilisant
la directive <directive module="mod_cache">CacheMaxExpire</directive>.</p>
</section>
<section>
<title>Guide succinct des requêtes conditionnelles</title>
<p>Lorsqu'un contenu est arrivé à expiration dans le cache et fait
l'objet d'une nouvelle demande d'accès, plutôt que traiter directement
la requête originale, httpd préfère utiliser une
requête conditionnelle.</p>
<p>HTTP propose toute une panoplie d'en-têtes qui permettent à un client,
ou au cache de distinguer les différentes versions d'un même contenu. Par
exemple, si une ressource a été servie avec un en-tête "Etag:", il est
possible de créer une requête conditionnelle contenant un en-tête
"If-None-Match:". Si une ressource a été servie avec un en-tête
"Last-Modified:", il est possible de créer une requête conditionnelle
contenant un en-tête "If-Modified-Since:", etc....</p>
<p>Lorsqu'une telle requête conditionnelle est créée, la reponse diffère
selon que le contenu satisfait ou non aux conditions. Si une requête est
créée avec un en-tête "If-Modified-Since:", et le contenu n'a pas été
modifié depuis le moment indiqué dans la requête, alors un laconique
"304 Not Modified" est retourné.</p>
<p>Si le contenu a été modifié, il est servi comme si la requête n'avait
pas été conditionnelle à l'origine.</p>
<p>Les bénéfices des requêtes conditionnelles pour ce qui concerne la
mise en cache sont de deux sortes. Premièrement, quand une telle requête
est envoyée au processus en arrière-plan, il sera aisé de déterminer
si le contenu que devra servir le processus en arrière-plan correspond
au contenu stocké dans le cache, sans être obligé de transmettre la
totalité de la ressource.</p>
<p>Deuxièmement, les requêtes conditionnelles sont en général moins
coûteuses en ressources pour le processus en arrière-plan.
Pour ce qui est des fichiers
statiques, l'action type est un appel à <code>stat()</code> ou un appel
système similaire, pour déterminer si la taille du fichier ou sa date de
modification ont changé. Ainsi, même si httpd met en cache le contenu
local, un contenu arrivé à expiration pourra être servi plus rapidement
depuis le cache s'il n'a pas été modifié, parce que la lecture depuis le
cache est plus rapide que la lecture depuis le processus en arrière-plan
(à comparer à la différence de vitesse entre la lecture depuis un cache en
mémoire avec <module>mod_cache_disk</module> et la lecture depuis un disque).</p>
</section>
<section>
<title>Que peut-on mettre en cache ?</title>
<p>Comme mentionné plus haut, les deux styles de mise en
cache de httpd
fonctionnent différemment; la mise en cache de
<module>mod_file_cache</module> conserve les contenus des fichiers
tels qu'ils étaient au démarrage de httpd. Quand une requête pour un
fichier mis en cache par ce module est envoyée, elle est interceptée
et le fichier mis en cache est servi.</p>
<p>La mise en cache de <module>mod_cache</module>, quant à elle, est
plus complexe. Lors du traitement d'une requête, le module de mise en
cache déterminera si le contenu peut être mis en cache, s'il ne l'a
pas déjà été auparavant. Les conditions qui permettent de déterminer
la possibilité de mise en cache d'une réponse sont :</p>
<ol>
<li>La mise en cache doit être activée pour cette URL. Voir les
directives <directive
module="mod_cache">CacheEnable</directive> et <directive
module="mod_cache">CacheDisable</directive>.</li>
<li>La reponse doit avoir un code de statut HTTP de 200, 203, 300, 301
ou 410.</li>
<li>La requête doit être de type HTTP GET.</li>
<li>Si la requête contient un en-tête "Authorization:", la réponse ne
sera pas mise en cache.</li>
<li>Si la réponse contient un en-tête "Authorization:", elle doit aussi
contenir une option "s-maxage", "must-revalidate" ou "public"
dans l'en-tête "Cache-Control:".</li>
<li>Si l'URL contient une chaîne de requête
(provenant par exemple d'une méthode GET de formulaire HTML), elle ne
sera pas mise en cache, à moins que la réponse ne
spécifie explicitement un délai d'expiration via un
en-tête "Expires:" ou une directive max-age ou s-maxage de
l'en-tête "Cache-Control:" comme indiqué dans les
sections 13.2.1. et 13.9 de la RFC2616.</li>
<li>Si la réponse a un statut de 200 (OK), elle doit aussi contenir
au moins un des en-têtes "Etag", "Last-Modified" ou
"Expires", ou une directive max-age ou s-maxage de
l'en-tête "Cache-Control:", à moins que la directive
<directive module="mod_cache">CacheIgnoreNoLastMod</directive>
ne précise d'autres contraintes.</li>
<li>Si la réponse contient l'option "private" dans un en-tête
"Cache-Control:", elle ne sera pas mise en cache à moins que la
directive
<directive module="mod_cache">CacheStorePrivate</directive>
ne précise d'autres contraintes.</li>
<li>De même, si la réponse contient l'option "no-store" dans un en-tête
"Cache-Control:", elle ne sera pas mise en cache à moins que la
directive
<directive module="mod_cache">CacheStoreNoStore</directive>
n'ait été utilisée.</li>
<li>Une réponse ne sera pas mise en cache si elle comporte un en-tête
"Vary:" contenant le caractère "*" qui correspond à toute
chaîne de caractères.</li>
</ol>
</section>
<section>
<title>Qu'est ce qui ne doit pas être mis en cache ?</title>
<p>En bref, tout contenu qui varie beaucoup avec le temps, ou en fonction
de particularités de la requête qui ne sont pas couvertes par la
négociation HTTP, ne doit pas être mis en cache.</p>
<p>Un contenu dynamique qui varie en fonction de l'adresse IP du
demandeur, ou est modifié toutes les 5 minutes, ne devra en général
pas être mis en cache.</p>
<p>Si par contre le contenu servi diffère en fonction de la valeur de
divers en-têtes HTTP, il se peut que l'on puisse le mettre en cache
intelligemment en utilisant un en-tête "Vary".</p>
</section>
<section>
<title>Contenu variable et/ou négocié</title>
<p>Si <module>mod_cache</module> reçoit une réponse contenant un en-tête
"Vary", lorsqu'un contenu a été demandé par un processus d'arrière-plan,
il va s'efforcer de la traiter intelligemment. Si possible,
<module>mod_cache</module> va détecter les en-têtes attribués dans la
réponse "Vary" à l'occasion des futures demandes, et servir une réponse
correcte à partir du cache.</p>
<p>Si par exemple, une réponse est reçue avec l'en-tête Vary suivant,</p>
<example>
Vary: negotiate,accept-language,accept-charset
</example>
<p><module>mod_cache</module> ne servira aux demandeurs que le contenu
mis en cache qui correspond au contenu des en-têtes accept-language et
accept-charset de la requête originale.</p>
</section>
</section>
<section id="security">
<title>Considérations sur la sécurité</title>
<section>
<title>Autorisation et contrôle d'accès</title>
<p>Utiliser <module>mod_cache</module> revient sensiblement à la même
chose qu'avoir un mandataire inverse intégré (reverse-proxy). Les requêtes
seront servies par le module de mise en cache sauf si ce dernier
détermine qu'un processus d'arrière-plan doit être appelé. La mise en
cache de ressources locales modifie considérablement le modèle de
sécurité de httpd.</p>
<p>Comme le parcours de la hiérarchie d'un système de fichiers pour
examiner le contenu d'éventuels fichiers
<code>.htaccess</code> serait une opération très coûteuse en ressources,
annulant partiellement de ce fait l'intérêt de la mise en cache
(accélérer le traitement des requêtes),
<module>mod_cache</module> ne se préoccupe pas de savoir s'il a
l'autorisation de servir une entité mise en cache. En d'autres termes,
si <module>mod_cache</module> a mis en cache un certain contenu, ce
dernier sera servi à partir du cache tant qu'il ne sera pas arrivé à
expiration.</p>
<p>Si par exemple, votre configuration autorise l'accès à une ressource
en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
pas mis en cache. Ceci est possible en utilisant la directive
<directive module="mod_cache">CacheDisable</directive>, ou le module
<module>mod_expires</module>. Livré à lui-même,
<module>mod_cache</module> - pratiquement comme un mandataire inverse -
mettrait en cache le contenu lors de son service, et le servirait ensuite
à tout client, vers n'importe quelle adresse IP.</p>
</section>
<section>
<title>Piratages locaux</title>
<p>Etant donné que les requêtes des utilisateurs finaux peuvent être
servies depuis le cache, ce dernier est une cible potentielle pour ceux
qui veulent défigurer un contenu ou interférer avec lui. Il est important
de garder à l'esprit que l'utilisateur sous lequel tourne
httpd doit
toujours avoir l'accès en écriture dans le cache. Ceci est en contraste
total avec la recommandation usuelle d'interdire à l'utilisateur sous
lequel tourne Apache
l'accès en écriture à tout contenu.</p>
<p>Si l'utilisateur sous lequel tourne Apache est compromis,
par exemple à cause d'une
faille de sécurité dans un processus CGI, il est possible que le cache
fasse l'objet d'une attaque. Il est relativement aisé d'insérer ou de
modifier une entité dans le cache en utilisant le module
<module>mod_cache_disk</module>.</p>
<p>Cela représente un risque relativement élévé par rapport aux autres
types d'attaques qu'il est possible de mener sous l'utilisateur apache.
Si vous utilisez <module>mod_cache_disk</module>, vous devez garder ceci
à l'esprit : effectuez toujours les mises à jour de
httpdquand des
correctifs de sécurité sont annoncés et exécutez les processus CGI sous
un utilisateur autre qu'apache en utilisant
<a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
</section>
<section>
<title>Empoisonnement du cache (Cache Poisoning)</title>
<p>Si vous utilisez httpd comme serveur mandataire avec mise en cache,
vous vous exposez aussi à un éventuel "Empoisonnement du
cache" (Cache poisoning). L'empoisonnement du cache est un terme général
pour désigner les attaques au cours desquelles l'attaquant fait en sorte
que le serveur mandataire renvoie à un contenu incorrect (et souvent
indésirable) suite à en provenance du serveur d'arrière-plan.
</p>
<p>Par exemple, si les serveur DNS qu'utilise votre système où tourne
httpd sont vulnérables à l'empoisonnement du cache des DNS, un attaquant
pourra contrôler vers où httpd se connecte lorsqu'il demande un contenu
depuis le serveur d'origine.
Un autre exemple est constitué par les attaques ainsi nommées
"Dissimulation de requêtes HTTP" (HTTP request-smuggling).</p>
<p>Ce document n'est pas le bon endroit pour une discussion approfondie
à propos de la Dissimulation de requêtes HTTP (utilisez plutôt votre
moteur de recherche favori); il est cependant important de savoir qu'il
est possible d'élaborer une série de requêtes, et d'exploiter une
vulnérabilité d'un serveur web d'origine de telle façon que l'attaquant
puisse contrôler entièrement le contenu renvoyé par le mandataire.</p>
</section>
</section>
<section id="filehandle">
<title>Mise en cache de la gestion de fichier</title>
<related>
<modulelist>
<module>mod_file_cache</module>
</modulelist>
<directivelist>
<directive module="mod_file_cache">CacheFile</directive>
</directivelist>
</related>
<p>Le fait d'ouvrir un fichier peut en lui-même introduire un délai,
en particulier dans les systèmes de fichiers répartis
sur le réseau. httpd
peut s'affranchir de ce délai en maintenant
un cache des descripteurs de fichiers
ouverts pour ce qui concerne les fichiers souvent
accédés. httpd propose
actuellement une implémentation de mise en cache de la
gestion de fichier.</p>
<section>
<title>Directive CacheFile</title>
<p>La forme la plus élémentaire de mise en cache que
propose httpd est
fournie par le module <module>mod_file_cache</module>.
Plutôt que de mettre en cache le contenu des fichiers, ce cache maintient
une table des descripteurs de fichiers ouverts. Les fichiers à mettre en
cache de cette manière sont spécifiés dans le fichier de configuration
en utilisant la directive
<directive module="mod_file_cache">CacheFile</directive>.</p>
<p>La directive
<directive module="mod_file_cache">CacheFile</directive> demande
à httpd
d'ouvrir le fichier lors de son démarrage et de réutiliser le descripteur
de fichier élaboré à cette occasion pour tous les
accès ultérieurs à ce fichier.</p>
<example>
CacheFile /usr/local/apache2/htdocs/index.html
</example>
<p>Si vous avez l'intention de mettre en cache un grand nombre de
fichiers de cette manière, vous devez vous assurer que le nombre maximum
de fichiers ouverts par votre système d'exploitation est correctement
défini.</p>
<p>Bien que l'utilisation de la directive
<directive module="mod_file_cache">CacheFile</directive>
n'entraîne pas la mise en cache du contenu du fichier, cela ne signifie
pas qu'en cas de modification du fichier pendant
l'exécution de httpd,
ces changements seront pris en compte. Le fichier sera toujours servi
dans l'état où il était quand httpd a démarré.</p>
<p>Si le fichier est supprimé pendant l'exécution de
httpd, ce dernier
continuera à maintenir un descripteur de fichier ouvert et à servir le
fichier dans l'état où il était quand httpd a démarré. Cela signifie
aussi habituellement que malgré le fait que le fichier ait été supprimé,
et ne soit
plus accessible par le système de fichiers, l'espace libéré ne sera
restitué qu'à l'arrêt de httpd quand le
descripteur de fichier sera fermé.</p>
</section>
</section>
<section id="inmemory">
<title>Mise en cache en mémoire</title>
<related>
<modulelist>
<module>mod_file_cache</module>
</modulelist>
<directivelist>
<directive module="mod_cache">CacheEnable</directive>
<directive module="mod_cache">CacheDisable</directive>
<directive module="mod_file_cache">MMapFile</directive>
</directivelist>
</related>
<p>Servir un contenu directement depuis la mémoire système est
universellement reconnu comme la méthode la plus rapide. Lire des fichiers
depuis un contrôleur de disque ou pire, depuis un réseau distant est plus
lent de plusieurs ordres de grandeur. Les contrôleurs de disque réalisent
en général des opérations mécaniques, et l'accès au réseau est limité par la
bande passante dont vous disposez. Par contre, les temps d'accès à la
mémoire sont de l'ordre de la nano-seconde.</p>
<p>Cependant la mémoire système n'est pas bon marché; à capacité égale,
c'est de loin le type de stockage le plus coûteux et il est important de
s'assurer qu'elle est utilisée efficacement. Le fait de mettre en cache
des fichiers en mémoire diminue d'autant la quantité de mémoire système
disponible. Comme nous le verrons plus loin, ce n'est pas un problème en
soi dans le cas de la mise en cache par l'intermédiaire du système
d'exploitation, mais si l'on utilise la mise en cache en mémoire propre à
httpd, il faut prendre garde à ne pas allouer trop de mémoire au cache.
Sinon le système sera contraint d'utiliser le swap, ce qui dégradera
sensiblement les performances.</p>
<section>
<title>Mise en cache par l'intermédiaire du système d'exploitation</title>
<p>Dans la plupart des systèmes d'exploitation modernes, c'est le noyau
qui gère directement la mise en cache en mémoire des données relatives
aux fichiers. C'est une fonctionnalité puissante, et les systèmes
d'exploitation s'en acquittent fort bien pour la plus grande partie.
Considérons par exemple, dans le cas de Linux, la différence entre le
temps nécessaire à la première lecture d'un fichier et le temps
nécessaire à sa deuxième lecture;</p>
<example><pre>
colm@coroebus:~$ time cat testfile > /dev/null
real 0m0.065s
user 0m0.000s
sys 0m0.001s
colm@coroebus:~$ time cat testfile > /dev/null
real 0m0.003s
user 0m0.003s
sys 0m0.000s</pre>
</example>
<p>Même pour ce petit fichier, il y a une grande différence entre les
temps nécessaires pour lire le fichier. Ceci est du au fait que le
noyau a mis en cache le contenu du fichier en mémoire.</p>
<p>Du fait de toujours pouvoir disposer de mémoire système, vous pouvez
être assuré qu'il y aura de plus en plus de contenus de fichiers stockés
dans ce cache. Ceci peut s'avérer une méthode de mise en cache en mémoire
très efficace, et ne nécessite aucune configuration supplémentaire
de httpd.</p>
<p>De plus, comme le système d'exploitation sait si des fichiers
ont été
supprimés ou modifiés, il peut effacer automatiquement des contenus de
fichiers du cache lorsque cela s'avère nécessaire. Ceci constitue un gros
avantage par rapport à la mise en cache en mémoire
de httpd qui n'a
aucune possibilité de savoir si un fichier a été modifié.</p>
</section>
<p>En dépit des performances et des avantages de la mise en cache
automatique par le système d'exploitation, la mise en cache en mémoire
peut être effectuée plus efficacement par httpd dans certaines
circonstances.</p>
<section>
<title>Mise en cache à l'aide de la directive MMapFile</title>
<p>La directive <directive module="mod_file_cache">MMapFile</directive>
fournie par le module <module>mod_file_cache</module> vous permet de
demander à httpd de charger un contenu de fichier statique en mémoire
lors de son démarrage (à l'aide de l'appel
système mmap). httpd
utilisera le contenu chargé en mémoire pour satisfaire ultérieurement
toutes les demandes d'accès à ce fichier.</p>
<example>
MMapFile /usr/local/apache2/htdocs/index.html
</example>
<p>Comme dans le cas de la directive
<directive module="mod_file_cache">CacheFile</directive>, toute
modification du fichier ne sera plus prise en compte par httpd une fois
ce dernier démarré.</p>
<p> La directive
<directive module="mod_file_cache">MMapFile</directive> ne gardant
pas la trace de la quantité de mémoire qu'elle alloue, vous devez prendre
garde de ne pas en abuser. Chaque processus enfant de httpd utilisant
sa propre réplique de la mémoire allouée, il est donc d'une importance
critique de s'assurer que les fichiers chargés ne sont pas d'une taille
trop importante afin d'épargner au système l'utilisation du swap.</p>
</section>
</section>
<section id="disk">
<title>Mise en cache sur disque</title>
<related>
<modulelist>
<module>mod_cache_disk</module>
</modulelist>
<directivelist>
<directive module="mod_cache">CacheEnable</directive>
<directive module="mod_cache">CacheDisable</directive>
</directivelist>
</related>
<p>Le module <module>mod_cache_disk</module> fournit un mécanisme de mise
en cache sur disque au module <module>mod_cache</module>. Cette mise en cache est
intelligente et le contenu ne sera servi qu'à partir du cache tant qu'il
sera considéré comme valide.</p>
<p>Typiquement, le module sera configuré comme suit :</p>
<example>
CacheRoot /var/cache/apache/<br />
CacheEnable disk /<br />
CacheDirLevels 2<br />
CacheDirLength 1
</example>
<p>Il est important de savoir que, les fichiers mis en cache étant stockés
localement, la mise en cache par l'intermédiaire du système d'exploitation
sera en général aussi appliquée à leurs accès. Si bien que même si les
fichiers sont stockés sur disque, s'il font l'objet d'accès fréquents,
il est probable que le système d'exploitation s'appliquera à ce qu'ils
soient servis à partir de la mémoire.</p>
<section>
<title>Comprendre le stockage dans le cache</title>
<p>Pour stocker des entités dans le cache,
le module <module>mod_cache_disk</module> crée une empreinte (hash) de 22
caractères de l'URL qui a fait l'objet d'une requête. Cette empreinte
comprend le nom d'hôte, le protocole, le port, le chemin et tout argument
de type CGI associé à l'URL, afin d'être sur que plusieurs URLs
n'interfèrent pas entre elles.</p>
<p>Chaque position de l'empreinte peut contenir un caractère
choisi parmi 64 caractères différents, il y a donc
64^22 possibilités pour une empreinte. Par exemple, une URL peut posséder
l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
utilisée pour préfixer les noms de fichiers spécifiques à cette URL à
l'intérieur du cache; cependant, elle est tout d'abord placée dans les
répertoires du cache selon les directives
<directive module="mod_cache_disk">CacheDirLevels</directive> et
<directive module="mod_cache_disk">CacheDirLength</directive>.</p>
<p>La directive
<directive module="mod_cache_disk">CacheDirLevels</directive>
définit le nombre de niveaux de sous-répertoires, et
<directive module="mod_cache_disk">CacheDirLength</directive>
le nombre de caractères composant le nom des sous-répertoires. Dans
l'exemple donné plus haut, l'empreinte se trouvera à :
<code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
<p>Cette technique a pour but principal de réduire le nombre de
sous-répertoires ou de fichiers contenus dans un répertoire particulier,
car le fonctionnement de la plupart des systèmes de fichiers est ralenti
quand ce nombre augmente. Avec la valeur "1" pour la directive
<directive module="mod_cache_disk">CacheDirLength</directive>,
il peut y avoir au plus 64 sous-répertoires à un niveau quelconque.
Avec la valeur "2", il peut y en avoir 64 * 64, etc...
A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
la valeur "1" pour la directive
<directive module="mod_cache_disk">CacheDirLength</directive>
est recommandée.</p>
<p>Le paramétrage de la directive
<directive module="mod_cache_disk">CacheDirLevels</directive>
dépend du nombre de fichiers que vous pensez stocker dans le cache.
Avec une valeur de "2" comme dans l'exemple donné plus haut,
4096 sous-répertoires peuvent être créés au total. Avec 1 million de
fichiers dans le cache, cela équivaut à environ 245 URLs mises en cache
dans chaque répertoire.</p>
<p>Chaque URL nécessite au moins deux fichiers dans le cache. Ce sont en
général un fichier ".header", qui contient des meta-informations à propos
de l'URL, comme la date de son arrivée à expiration,
et un fichier ".data" qui est la copie exacte du contenu à servir.</p>
<p>Dans le cas d'un contenu négocié via l'en-tête "Vary", un répertoire
".vary" sera créé pour l'URL en question. Ce répertoire contiendra de
multiples fichiers ".data" correspondant aux différents contenus
négociés.</p>
</section>
<section>
<title>Maintenance du cache sur disque</title>
<p>Bien que le module <module>mod_cache_disk</module> supprime un contenu
du cache lorsqu'il est arrivé à expiration, il ne maintient aucune
information à propos de la taille totale du cache ou de l'espace restant
disponible.</p>
<p>Par contre l'utilitaire
<a href="programs/htcacheclean.html">htcacheclean</a> fourni avec
httpd
vous permet, comme son nom l'indique, de nettoyer le cache périodiquement.
Déterminer la fréquence à laquelle lancer <a
href="programs/htcacheclean.html">htcacheclean</a> et la taille souhaitée
pour le cache est une tâche relativement complexe et il vous faudra de
nombreux essais et erreurs pour arriver à sélectionner des valeurs
optimales.</p>
<p><a href="programs/htcacheclean.html">htcacheclean</a> opère selon deux
modes. Il peut s'exécuter comme démon résident, ou être lancé
périodiquement par cron. <a
href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
ou plus pour traiter de très grands caches (plusieurs dizaines de
Gigaoctets) et si vous l'exécutez à partir de cron, il vous est
conseillé de déterminer la durée typique d'un traitement, afin d'éviter
d'exécuter plusieurs instances à la fois.</p>
<p class="figure">
<img src="images/caching_fig1.gif" alt="" width="600"
height="406" /><br />
<a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
typique du cache / séquence de nettoyage.</p>
<p>Comme <module>mod_cache_disk</module> ne tient pas compte de l'espace
utilisé dans le cache, vous devez vous assurer que
<a href="programs/htcacheclean.html">htcacheclean</a> est configuré de
façon à laisser suffisamment d'"espace de croissance"
à la suite d'un nettoyage.</p>
</section>
</section>
</manualpage>
|