<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta name=Title content=""><meta name=Keywords content=""><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 15 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:Arial;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:Calibri;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman";}
span.EmailStyle18
        {mso-style-type:personal;
        font-family:Calibri;
        color:windowtext;}
span.EmailStyle19
        {mso-style-type:personal;
        font-family:Calibri;
        color:windowtext;}
span.EmailStyle20
        {mso-style-type:personal;
        font-family:Calibri;
        color:windowtext;}
span.EmailStyle21
        {mso-style-type:personal;
        font-family:Calibri;
        color:windowtext;}
span.EmailStyle22
        {mso-style-type:personal;
        font-family:Calibri;
        color:windowtext;}
span.EmailStyle23
        {mso-style-type:personal-reply;
        font-family:Calibri;
        color:windowtext;}
span.msoIns
        {mso-style-type:export-only;
        mso-style-name:"";
        text-decoration:underline;
        color:teal;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style></head><body bgcolor=white lang=EN-US link="#0563C1" vlink="#954F72"><div class=WordSection1><p class=MsoNormal>No, the subdirectories will be the same &#8211; you&#8217;ll just need to replace the bit that leads up to the documents directory.<o:p></o:p></p><p class=MsoNormal><o:p>&nbsp;</o:p></p><p class=MsoNormal><o:p>&nbsp;</o:p></p><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'><p class=MsoNormal style='margin-left:36.0pt'><b><span style='color:black'>From: </span></b><span style='color:black'>&lt;eprints-tech-bounces@ecs.soton.ac.uk&gt; on behalf of Andrew Beeken &lt;anbeeken@lincoln.ac.uk&gt;<br><b>Reply-To: </b>&lt;eprints-tech@ecs.soton.ac.uk&gt;<br><b>Date: </b>Wednesday, 29 March 2017 14:44<br><b>To: </b>&quot;eprints-tech@ecs.soton.ac.uk&quot; &lt;eprints-tech@ecs.soton.ac.uk&gt;<br><b>Subject: </b>Re: [EP-tech] Dissecting the Documents folder</span><span style='font-size:12.0pt;color:black'><o:p></o:p></span></p></div><div><p class=MsoNormal style='margin-left:36.0pt'><span style='font-family:"Times New Roman"'><o:p>&nbsp;</o:p></span></p></div><p class=MsoNormal style='margin-left:36.0pt'>Ah, that makes sense. So will I need to factor that in when I&#8217;m doing an XML rewrite?<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>&nbsp;<o:p></o:p></p><div><div style='border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm'><p class=MsoNormal style='margin-left:36.0pt'><b>From:</b> eprints-tech-bounces@ecs.soton.ac.uk [mailto:eprints-tech-bounces@ecs.soton.ac.uk] <b>On Behalf Of </b>Adam Field<br><b>Sent:</b> 29 March 2017 14:32<br><b>To:</b> eprints-tech@ecs.soton.ac.uk<br><b>Subject:</b> Re: [EP-tech] Dissecting the Documents folder<o:p></o:p></p></div></div><p class=MsoNormal style='margin-left:36.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>it&#8217;s the eprint id, padded with zeros and then broken up into pairs of digits to make directory names.&nbsp; That way there&#8217;s only ever 100 directories in each directory.<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>--<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>Adam<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'>&nbsp;<o:p></o:p></p><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'><p class=MsoNormal style='margin-left:72.0pt'><b><span style='color:black'>From: </span></b><span style='color:black'>&lt;<a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk">eprints-tech-bounces@ecs.soton.ac.uk</a>&gt; on behalf of Andrew Beeken &lt;<a href="mailto:anbeeken@lincoln.ac.uk">anbeeken@lincoln.ac.uk</a>&gt;<br><b>Reply-To: </b>&lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>&gt;<br><b>Date: </b>Wednesday, 29 March 2017 13:37<br><b>To: </b>&quot;<a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>&quot; &lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>&gt;<br><b>Subject: </b>Re: [EP-tech] Dissecting the Documents folder</span><o:p></o:p></p></div><div><p class=MsoNormal style='margin-left:72.0pt'><span style='font-family:"Times New Roman"'>&nbsp;</span><o:p></o:p></p></div><p class=MsoNormal style='margin-left:72.0pt'>You know me all too well ;)<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>So that should work? I was only wondering because I know that under the Documents folder the structure seems rather ambiguous to me, 00 with 00, 01 and 02 and further numbers underneath that. Is there a method to that?<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><div><div style='border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm'><p class=MsoNormal style='margin-left:72.0pt'><b>From:</b> <a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk">eprints-tech-bounces@ecs.soton.ac.uk</a> [<a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk">mailto:eprints-tech-bounces@ecs.soton.ac.uk</a>] <b>On Behalf Of </b>Adam Field<br><b>Sent:</b> 29 March 2017 11:56<br><b>To:</b> <a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a><br><b>Subject:</b> Re: [EP-tech] Dissecting the Documents folder<o:p></o:p></p></div></div><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>Hi Andrew<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; If it were anyone but you, I&#8217;d recommend doing a mysqldump and keeping all paths the same as the simplest way to migrate a repository.&nbsp; However, I&#8217;m sure you&#8217;ll counter that with &#8220;&#8230;but my repository is non-standard and I&#8217;m trying to make it standard&#8221;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; When I&#8217;ve had to monkey around with paths in XML files, I&#8217;ve usually done it with vim and find/replace commands.&nbsp; Move the documents directory to the new server into a temporary directory, then compare the path in the XML file to the path on disk.&nbsp; This will help you understand what string replacement you need to do.&nbsp; The command will be something like:<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>:%s/\/usr\/share\/eprint3\/archives\/foo\/documents/\/home\/anbeeken\/migration\/documents/g<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ...it may take some time to run.<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>--<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>Adam<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'>&nbsp;<o:p></o:p></p><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'><p class=MsoNormal style='margin-left:108.0pt'><b><span style='color:black'>From: </span></b><span style='color:black'>&lt;<a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk">eprints-tech-bounces@ecs.soton.ac.uk</a>&gt; on behalf of Andrew Beeken &lt;<a href="mailto:anbeeken@lincoln.ac.uk">anbeeken@lincoln.ac.uk</a>&gt;<br><b>Reply-To: </b>&lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>&gt;<br><b>Date: </b>Wednesday, 29 March 2017 11:38<br><b>To: </b>&quot;<a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>&quot; &lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>&gt;<br><b>Subject: </b>[EP-tech] Dissecting the Documents folder</span><o:p></o:p></p></div><div><p class=MsoNormal style='margin-left:108.0pt'><span style='font-family:"Times New Roman"'>&nbsp;</span><o:p></o:p></p></div><p class=MsoNormal style='margin-left:108.0pt'>Hi all,<o:p></o:p></p><p class=MsoNormal style='margin-left:108.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:108.0pt'>I&#8217;m looking into the best options for migrating EPrints to a new server and investigating the possibility of pulling our 43.6Gb worth of documents across so as not to embed them in XML and create large files. I know that I can bring the Documents folder over, however I&#8217;m not sure how to interpret the folder structure to rewrite the URL&#8217;s in the XML export. Any thoughts?<o:p></o:p></p><p class=MsoNormal style='margin-left:108.0pt'>&nbsp;<o:p></o:p></p><p class=MsoNormal style='margin-left:108.0pt'>Andrew<o:p></o:p></p><div><p class=MsoNormal style='margin-left:108.0pt'><span style='font-size:10.0pt;font-family:"Times New Roman"'><br><b>The University of Lincoln, located in the heart of the city of Lincoln, has established an international reputation based on high student satisfaction, excellent graduate employment and world-class research.</b></span><o:p></o:p></p></div><div><p class=MsoNormal style='margin-left:108.0pt'><span style='font-size:7.5pt;font-family:Arial'><br>The information in this e-mail and any attachments may be confidential. If you have received this email in error please notify the sender immediately and remove it from your system. Do not disclose the contents to another person or take copies.<br><br>Email is not secure and may contain viruses. The University of Lincoln makes every effort to ensure email is sent without viruses, but cannot guarantee this and recommends recipients take appropriate precautions.<br><br>The University may monitor email traffic data and content in accordance with its policies and English law. Further information can be found at: <a href="http://www.lincoln.ac.uk/legal">http://www.lincoln.ac.uk/legal</a>.</span><o:p></o:p></p></div><p class=MsoNormal style='margin-left:108.0pt'><span style='font-size:12.0pt;font-family:"Times New Roman"'>*** Options: <a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a> *** Archive: <a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a> *** EPrints community wiki: <a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a> *** EPrints developers Forum: <a href="http://forum.eprints.org/">http://forum.eprints.org/</a> </span><o:p></o:p></p><p class=MsoNormal style='margin-left:72.0pt'><span style='font-size:12.0pt;font-family:"Times New Roman"'>*** Options: <a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a> *** Archive: <a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a> *** EPrints community wiki: <a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a> *** EPrints developers Forum: <a href="http://forum.eprints.org/">http://forum.eprints.org/</a> </span><o:p></o:p></p><p class=MsoNormal style='margin-left:36.0pt'><span style='font-size:12.0pt;font-family:"Times New Roman"'>*** Options: http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech *** Archive: http://www.eprints.org/tech.php/ *** EPrints community wiki: http://wiki.eprints.org/ *** EPrints developers Forum: http://forum.eprints.org/ <o:p></o:p></span></p></div></body></html>