<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal"><span style="color:#1F497D">Hi Michele,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">There are a couple of config variables that might be worth looking for in the archive config:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">cache_maxlife (maximum age of a cache table)<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">cache_max (number of cache tables to keep)<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">If these aren't set, then it might mean cache tables aren't considered for removal.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">They *<b>should</b>* get cleaned up by - EPrints::DataObj::Cachemap::cleanup, which is called as part of the Apache cleanup process - registered in EPrints::DataObj::Cachemap::create_from_data.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Each cache tables should have a reference within the cachemap table. If this isn't the case, then they are 'proper' orphans, and may need to be removed manually.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">If you have a block of orphaned tables that are all from a similar date/time it may point to an issue at some point e.g. an Apache crash that resulted in the cleanup not happening properly.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">It could also be that under Apache2.4 &nbsp;(or if you're running an 'interesting' config with other elements - fcgi or similar) that the cleanup phase isn't acted upon.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">In general terms, EPrints isn't affected by the existence of lots of cache tables.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">The database server might be impacted - if there are 1,000's of them - and it's trying to keep things in memory etc.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Hope that helps a bit - let me know if you have more questions!<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Cheers,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">John<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US" style="mso-fareast-language:EN-GB">From:</span></b><span lang="EN-US" style="mso-fareast-language:EN-GB"> eprints-tech-bounces@ecs.soton.ac.uk [mailto:eprints-tech-bounces@ecs.soton.ac.uk]
<b>On Behalf Of </b>Michele Morelli via Eprints-tech<br>
<b>Sent:</b> 26 September 2018 11:07<br>
<b>To:</b> eprints-tech@ecs.soton.ac.uk<br>
<b>Subject:</b> [EP-tech] Does a proliferation of cache tables effect simple search performance?<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Good morning All,<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">I was wondering whether anyone else incurred into this aspect of Eprints&#8217; Simple Search, and whether this is the intended way it should work.<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Every time a simple search is performed, Eprints creates a new cache table in the database &#8211; these tables are named with a &#8216;cache[0-9]&#43;&#8217; format. &nbsp;<o:p></o:p></p>
<p class="MsoNormal">Eprints does not appear consider these cache tables as orphaned, and therefore these tables seem to remain in the database &#8211; it may happen that a large multitude of these tables are left in the database.<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">I would be curious to know more about these tables:<o:p></o:p></p>
<p class="MsoNormal">1 &#8211; Are these cache tables eventually supposed to be dropped by any process? &#8216;epadmin cleanup_cachemaps&#8217; leaves these tables untouched, as it does not consider them as orphaned;<o:p></o:p></p>
<p class="MsoNormal">2 &#8211; Does a proliferation of cache tables impact the simple search performance? Having overabundance of cache tables to look through seems to me that can bring unwanted overhead to DB-related processes, but I might be missing something obvious;<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Thank you &#8211; have a nice day!<o:p></o:p></p>
<p class="MsoNormal">Michele <o:p></o:p></p>
</div>
</body>
</html>