<html><body>
<p><font size="2" face="sans-serif">OK, it is on GitHub now: </font><a href="https://github.com/eprintsug/LinkCheck"><font size="2" face="sans-serif">https://github.com/eprintsug/LinkCheck</font></a><br>
<br>
<font size="2" face="sans-serif">Regards,</font><br>
<br>
<font size="2" face="sans-serif">Martin</font><br>
<br>
<br>
<img width="16" height="16" src="cid:1__=4EBB0B95DFD9470A8f9e8a93df9@lotus.uzh.ch" border="0" alt="Inactive hide details for Centro de Documentación ---11/04/2017 18:52:40---Hi Martin, I like it :) It's a very useful tool. No "><font size="2" color="#424282" face="sans-serif">Centro de Documentación ---11/04/2017 18:52:40---Hi Martin, I like it :) It's a very useful tool. No one likes dead links.</font><br>
<br>
<font size="1" color="#5F5F5F" face="sans-serif">Von:        </font><font size="1" face="sans-serif">Centro de Documentación &lt;cendocu@gmail.com&gt;</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">An:        </font><font size="1" face="sans-serif">eprints-tech@ecs.soton.ac.uk</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">Datum:        </font><font size="1" face="sans-serif">11/04/2017 18:52</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">Betreff:        </font><font size="1" face="sans-serif">Re: [EP-tech] Linkcheck</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">Gesendet von:        </font><font size="1" face="sans-serif">eprints-tech-bounces@ecs.soton.ac.uk</font><br>
<hr width="100%" size="2" align="left" noshade style="color:#8091A5; "><br>
<br>
<br>
<tt><font size="2">Hi Martin,<br>
<br>
I like it :) It's a very useful tool. No one likes dead links.<br>
<br>
Regards,<br>
<br>
Cristian<br>
<br>
On Fri, Apr 7, 2017 at 1:03 PM, &nbsp;&lt;martin.braendle@id.uzh.ch&gt; wrote:<br>
&gt; Hi,<br>
&gt;<br>
&gt; I just wrote a linkcheck crawler that checks the remote URLs stored in an<br>
&gt; EPrints repo and updates the issues list for URLs that have an invalid<br>
&gt; format or report HTTP status codes other than 200.<br>
&gt; Please let me know if there is an interest to have it available, then I will<br>
&gt; put it on GitHub. There's some more work to do, e.g. move some of the<br>
&gt; methods to a plugin so that they can be called from elsewhere.<br>
&gt;<br>
&gt; Please also be aware that by applying a linkcheck crawler your editorial<br>
&gt; team may come under strain to fix all the dead links. Our initial run<br>
&gt; revealed that after 10 years of running our repository, about 25% of the<br>
&gt; URLs (about 7500 in our case) are now working anymore.<br>
&gt;<br>
&gt; The script also produces a report by HTTP status code and that is sorted<br>
&gt; either by eprint id or by URL. The latter allows to identify patterns so<br>
&gt; that URLs can be replaced or removed in batch.<br>
&gt;<br>
&gt; Best regards,<br>
&gt;<br>
&gt; Martin<br>
&gt;<br>
&gt; --<br>
&gt; Dr. Martin Brändle<br>
&gt; Zentrale Informatik<br>
&gt; Universität Zürich<br>
&gt; Stampfenbachstr. 73<br>
&gt; CH-8006 Zürich<br>
&gt;<br>
</font></tt><tt><font size="2"><br>
</font></tt><br>
<br>
</body></html>