<html><body>
<p><font size="2" face="sans-serif">Hi,</font><br>
<br>
<font size="2" face="sans-serif">thanks also to Adam Field who reviewed my code and provided useful suggestions.</font><br>
<br>
<font size="2" face="sans-serif">If you have not done yet, you should get the latest revision which returns an XML error code if the NCBI server fails from </font><a href="https://github.com/eprintsug/PubMedID-Import"><font size="2" face="sans-serif">https://github.com/eprintsug/PubMedID-Import</font></a><font size="2" face="sans-serif">&nbsp;.</font><br>
<br>
<font size="2" face="sans-serif">Also, Jens had updated the metadata_update script that uses PubMed too and provides it at the URL above.</font><br>
<br>
<font size="2" face="sans-serif">Regards,</font><br>
<br>
<font size="2" face="sans-serif">Martin</font><br>
<br>
<font size="2" face="sans-serif">--</font><br>
<font size="2" face="sans-serif">Dr. Martin Brändle</font><br>
<font size="2" face="sans-serif">Zentrale Informatik</font><br>
<font size="2" face="sans-serif">Universität Zürich</font><br>
<font size="2" face="sans-serif">Stampfenbachstr. 73</font><br>
<font size="2" face="sans-serif">CH-8006 Zürich</font><br>
<br>
<br>
<img width="16" height="16" src="cid:1__=4EBB0AF5DFB91FB88f9e8a93df9@lotus.uzh.ch" border="0" alt="Inactive hide details for Hiroshi Watabe ---09/11/2016 01:03:35---Dear Martin, Thank you for your code. Now it works for me (al"><font size="2" color="#424282" face="sans-serif">Hiroshi Watabe ---09/11/2016 01:03:35---Dear Martin, Thank you for your code. Now it works for me (although I must skip</font><br>
<br>
<font size="1" color="#5F5F5F" face="sans-serif">Von:        </font><font size="1" face="sans-serif">Hiroshi Watabe &lt;hwatabe@m.tohoku.ac.jp&gt;</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">An:        </font><font size="1" face="sans-serif">eprints-tech@ecs.soton.ac.uk</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">Datum:        </font><font size="1" face="sans-serif">09/11/2016 01:03</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">Betreff:        </font><font size="1" face="sans-serif">Re: [EP-tech] Antwort: Antwort: Re: Antwort: Re: fail to import PubMedID</font><br>
<font size="1" color="#5F5F5F" face="sans-serif">Gesendet von:        </font><font size="1" face="sans-serif">eprints-tech-bounces@ecs.soton.ac.uk</font><br>
<hr width="100%" size="2" align="left" noshade style="color:#8091A5; "><br>
<br>
<br>
<tt><font size="2">Dear Martin,<br>
<br>
Thank you for your code. Now it works for me (although I must skip<br>
duplication check because my table does not have eprint.pubmedid).<br>
<br>
Regards,<br>
<br>
Hiroshi<br>
 On Tue, 8 Nov 2016<br>
12:52:43 +0100 martin.braendle@id.uzh.ch wrote:<br>
<br>
&gt; I have published our version of the PubMedID Import plugin to<br>
&gt; <br>
&gt; </font></tt><tt><font size="2"><a href="https://github.com/eprintsug/PubMedID-Import">https://github.com/eprintsug/PubMedID-Import</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; It has been updated to cope with the https protocol that NCBI uses<br>
&gt; and also contains some code that does a duplicate check in the<br>
&gt; EPrints repo. See also attached phrases files (English and German).<br>
&gt; <br>
&gt; Feel free to use from this code whatever you think is useful for your<br>
&gt; implementation.<br>
&gt; <br>
&gt; Best regards,<br>
&gt; <br>
&gt; Martin<br>
&gt; <br>
&gt; --<br>
&gt; Dr. Martin Brändle<br>
&gt; Zentrale Informatik<br>
&gt; Universität Zürich<br>
&gt; Stampfenbachstr. 73<br>
&gt; CH-8006 Zürich<br>
&gt; <br>
&gt; mail: martin.braendle@id.uzh.ch<br>
&gt; phone: +41 44 63 56705<br>
&gt; fax: +41 44 63 54505<br>
&gt; </font></tt><tt><font size="2"><a href="http://www.zi.uzh.ch">http://www.zi.uzh.ch</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; Von:                 jens.vieler@id.uzh.ch<br>
&gt; An:                 eprints-tech@ecs.soton.ac.uk<br>
&gt; Datum:                 07/11/2016 16:05<br>
&gt; Betreff:                 [EP-tech] Antwort: Re: &nbsp;Antwort: Re: &nbsp;fail to import<br>
&gt; PubMedID Gesendet von:                 eprints-tech-bounces@ecs.soton.ac.uk<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; ...i think, it is more general if XML::LibXML can't deal with https.<br>
&gt; So it's here: perl_lib/EPrints/XML/LibXML.pm (Line 69) and<br>
&gt; 'XML::LibXML-&gt;new ();' is the wrong parser for our needs.<br>
&gt; <br>
&gt; What would you suggest? Changing Import/PubMedID.pm and<br>
&gt; bin/metadata_update from anything like<br>
&gt; <br>
&gt; EPrints::XML::parse_url( $url );<br>
&gt; <br>
&gt; to something like<br>
&gt; <br>
&gt; - using LWP to retrieve it<br>
&gt; - then LibXML to decode it to xml<br>
&gt; <br>
&gt; or create a more general and new EPrints::XML module?<br>
&gt; <br>
&gt; Workarounds or other quick &amp; dirtys are also welcome<br>
&gt; <br>
&gt; Jens<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; --<br>
&gt; Jens Vieler<br>
&gt; Zentrale Informatik<br>
&gt; Universität Zürich<br>
&gt; Stampfenbachstrasse 73<br>
&gt; CH-8006 Zürich<br>
&gt; <br>
&gt; mail: &nbsp;jens.vieler@id.uzh.ch<br>
&gt; phone: +41 44 63 56777<br>
&gt; </font></tt><tt><font size="2"><a href="http://www.id.uzh.ch">http://www.id.uzh.ch</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; Inactive hide details for Adam Field ---07.11.2016 14:39:46---….on,<br>
&gt; incidentally, it’s this line: </font></tt><tt><font size="2"><a href="https://github.com/eprints/Adam">https://github.com/eprints/Adam</a></font></tt><tt><font size="2">&nbsp;Field<br>
&gt; ---07.11.2016 14:39:46---….on, incidentally, it’s this line:<br>
&gt; </font></tt><tt><font size="2"><a href="https://github.com/eprints/eprints/blob/3.3/perl_lib/EPrints/Plu">https://github.com/eprints/eprints/blob/3.3/perl_lib/EPrints/Plu</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; Von: Adam Field &lt;Adam.Field@jisc.ac.uk&gt;<br>
&gt; An: &quot;eprints-tech@ecs.soton.ac.uk&quot; &lt;eprints-tech@ecs.soton.ac.uk&gt;<br>
&gt; Datum: 07.11.2016 14:39<br>
&gt; Betreff: Re: [EP-tech] Antwort: Re: &nbsp;fail to import PubMedID<br>
&gt; Gesendet von: eprints-tech-bounces@ecs.soton.ac.uk<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; ….on, incidentally, it’s this line:<br>
&gt; <br>
&gt; </font></tt><tt><font size="2"><a href="https://github.com/eprints/eprints/blob/3.3/perl_lib/EPrints/Plugin/Import/PubMedID.pm#L58">https://github.com/eprints/eprints/blob/3.3/perl_lib/EPrints/Plugin/Import/PubMedID.pm#L58</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; |-----------------------------|<br>
&gt; | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |<br>
&gt; |-----------------------------|<br>
&gt; |Adam Field &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |<br>
&gt; |SHERPA services analyst &nbsp; &nbsp; &nbsp;|<br>
&gt; |developer &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|<br>
&gt; |-----------------------------|<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; From: Adam Field &lt;Adam.Field@jisc.ac.uk&gt;<br>
&gt; Date: Monday, 7 November 2016 13:32<br>
&gt; To: &quot;eprints-tech@ecs.soton.ac.uk&quot; &lt;eprints-tech@ecs.soton.ac.uk&gt;<br>
&gt; Subject: Re: [EP-tech] Antwort: Re: fail to import PubMedID<br>
&gt; <br>
&gt; I can confirm this – I can also download the metadata via https using<br>
&gt; curl.<br>
&gt; <br>
&gt; Jens’ suggestions are good. &nbsp;We should be able to respond to this<br>
&gt; kind of thing as a community – it’s a non-core, simple bug. &nbsp;I’m<br>
&gt; happy to offer advice, code review and testing if anyone wants to<br>
&gt; give it a stab. Alternatively, is there anyone out there who can<br>
&gt; offer me the same if I take a stab?<br>
&gt; <br>
&gt; Best<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; |-----------------------------|<br>
&gt; | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |<br>
&gt; |-----------------------------|<br>
&gt; |Adam Field &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |<br>
&gt; |SHERPA services analyst &nbsp; &nbsp; &nbsp;|<br>
&gt; |developer &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|<br>
&gt; |-----------------------------|<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; From: &lt;eprints-tech-bounces@ecs.soton.ac.uk&gt; on behalf of<br>
&gt; &quot;jens.vieler@id.uzh.ch&quot; &lt;jens.vieler@id.uzh.ch&gt;<br>
&gt; Reply-To: &quot;eprints-tech@ecs.soton.ac.uk&quot;<br>
&gt; &lt;eprints-tech@ecs.soton.ac.uk&gt; Date: Monday, 7 November 2016 10:45<br>
&gt; To: &quot;eprints-tech@ecs.soton.ac.uk&quot; &lt;eprints-tech@ecs.soton.ac.uk&gt;<br>
&gt; Subject: [EP-tech] Antwort: Re: fail to import PubMedID<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; Dear Adam, Hiroshi, List<br>
&gt; <br>
&gt; Watching the same since this morning #-) ...they changed to https this<br>
&gt; weekend.<br>
&gt; <br>
&gt; wget'ing https works fine, but we canot simply change the protocol in<br>
&gt; our script, because it seems LibXML can't handle it. So what about<br>
&gt; getting the https from out of the script and change parse_url into<br>
&gt; parse_file on that local file. Or change to LWP::Protocol::https?<br>
&gt; <br>
&gt; Jens<br>
&gt; <br>
&gt; <br>
&gt; --<br>
&gt; Jens Vieler<br>
&gt; Zentrale Informatik<br>
&gt; Universität Zürich<br>
&gt; Stampfenbachstrasse 73<br>
&gt; CH-8006 Zürich<br>
&gt; <br>
&gt; mail: &nbsp;jens.vieler@id.uzh.ch<br>
&gt; phone: +41 44 63 56777<br>
&gt; </font></tt><tt><font size="2"><a href="http://www.id.uzh.ch">http://www.id.uzh.ch</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; active hide details for Adam Field ---07.11.2016 11:30:30---Visiting<br>
&gt; the Adam Field ---07.11.2016 11:30:30---Visiting the URL, I get:<br>
&gt; &lt;eFetchResult&gt;<br>
&gt; <br>
&gt; Von: Adam Field &lt;Adam.Field@jisc.ac.uk&gt;<br>
&gt; An: &quot;eprints-tech@ecs.soton.ac.uk&quot; &lt;eprints-tech@ecs.soton.ac.uk&gt;<br>
&gt; Datum: 07.11.2016 11:30<br>
&gt; Betreff: Re: [EP-tech] fail to import PubMedID<br>
&gt; Gesendet von: eprints-tech-bounces@ecs.soton.ac.uk<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; Visiting the URL, I get:<br>
&gt; <br>
&gt; &lt;eFetchResult&gt;<br>
&gt; &lt;ERROR&gt;WebEnv parameter is required&lt;/ERROR&gt;<br>
&gt; &lt;/eFetchResult&gt;<br>
&gt; <br>
&gt; If I add a dummy WebEnb parameter, I get:<br>
&gt; <br>
&gt; &lt;eFetchResult&gt;<br>
&gt; &lt;ERROR&gt;query_key parameter is required&lt;/ERROR&gt;<br>
&gt; &lt;/eFetchResult&gt;<br>
&gt; <br>
&gt; …it looks like the API the plugin is using has changed L &nbsp;It’s<br>
&gt; unlikely to be a local problem.<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; |-----------------------|<br>
&gt; | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |<br>
&gt; |-----------------------|<br>
&gt; | &nbsp; &nbsp; &nbsp;Adam Field &nbsp; &nbsp; &nbsp; |<br>
&gt; | &nbsp; &nbsp; &nbsp;SHERPA services &nbsp;|<br>
&gt; | &nbsp; &nbsp; &nbsp;analyst developer|<br>
&gt; |-----------------------|<br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; From: &lt;eprints-tech-bounces@ecs.soton.ac.uk&gt; on behalf of Hiroshi<br>
&gt; Watabe &lt;hwatabe@m.tohoku.ac.jp&gt;<br>
&gt; Organization: CYRIC<br>
&gt; Reply-To: &quot;eprints-tech@ecs.soton.ac.uk&quot;<br>
&gt; &lt;eprints-tech@ecs.soton.ac.uk&gt; Date: Monday, 7 November 2016 01:27<br>
&gt; To: &quot;eprints-tech@ecs.soton.ac.uk&quot; &lt;eprints-tech@ecs.soton.ac.uk&gt;<br>
&gt; Subject: [EP-tech] fail to import PubMedID<br>
&gt; <br>
&gt; Dear all,<br>
&gt; <br>
&gt; It seems PubMed only accepts https now and I cannot import PubMed ID<br>
&gt; anymore. I got the following warning message.<br>
&gt; Unhandled warning in Import::PubMedID: http error : Unknown IO error<br>
&gt; <br>
&gt; I modified PubMedID.pm as follows but no success.<br>
&gt; 27c27<br>
&gt; &lt; &nbsp; &nbsp; &nbsp; $self-&gt;{EFETCH_URL} =<br>
&gt; '<br>
&gt; </font></tt><tt><font size="2"><a href="http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&retmode=xml&rettype=full">http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&amp;retmode=xml&amp;rettype=full</a></font></tt><tt><font size="2"><br>
&gt; ';<br>
&gt; ---<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;$self-&gt;{EFETCH_URL} =<br>
&gt; &nbsp; &nbsp; &nbsp; '<br>
&gt; &nbsp; &nbsp; &nbsp; </font></tt><tt><font size="2"><a href="https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&retmode=xml&rettype=full">https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&amp;retmode=xml&amp;rettype=full</a></font></tt><tt><font size="2"><br>
&gt; &nbsp; &nbsp; &nbsp; ';<br>
&gt; <br>
&gt; Error message is as follows;<br>
&gt; Unhandled exception in Import::PubMedID: Could not create file parser<br>
&gt; context for file<br>
&gt; <br>
&gt; Could you help me?<br>
&gt; <br>
&gt; Hiroshi<br>
&gt; *** Options:<br>
&gt; </font></tt><tt><font size="2"><a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a></font></tt><tt><font size="2">&nbsp;***<br>
&gt; Archive: </font></tt><tt><font size="2"><a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a></font></tt><tt><font size="2">&nbsp;*** EPrints community wiki:<br>
&gt; </font></tt><tt><font size="2"><a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a></font></tt><tt><font size="2">&nbsp;*** EPrints developers Forum:<br>
&gt; </font></tt><tt><font size="2"><a href="http://forum.eprints.org/">http://forum.eprints.org/</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; Jisc is a registered charity (number 1149740) and a company limited by<br>
&gt; guarantee which is registered in England under Company No. 5747339,<br>
&gt; VAT No. GB 197 0632 86. Jisc’s registered office is: One Castlepark,<br>
&gt; Tower Hill, Bristol, BS2 0JA. T 0203 697 5800.<br>
&gt; <br>
&gt; Jisc Services Limited is a wholly owned Jisc subsidiary and a company<br>
&gt; limited by guarantee which is registered in England under company<br>
&gt; number 2881024, VAT number GB 197 0632 86. The registered office is:<br>
&gt; One Castle Park, Tower Hill, Bristol BS2 0JA. T 0203 697 5800. ***<br>
&gt; Options: </font></tt><tt><font size="2"><a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a></font></tt><tt><font size="2"><br>
&gt; *** Archive: </font></tt><tt><font size="2"><a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a></font></tt><tt><font size="2"><br>
&gt; *** EPrints community wiki: </font></tt><tt><font size="2"><a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a></font></tt><tt><font size="2"><br>
&gt; *** EPrints developers Forum: </font></tt><tt><font size="2"><a href="http://forum.eprints.org/***">http://forum.eprints.org/***</a></font></tt><tt><font size="2">&nbsp;Options:<br>
&gt; </font></tt><tt><font size="2"><a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a></font></tt><tt><font size="2"><br>
&gt; *** Archive: </font></tt><tt><font size="2"><a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a></font></tt><tt><font size="2"><br>
&gt; *** EPrints community wiki: </font></tt><tt><font size="2"><a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a></font></tt><tt><font size="2"><br>
&gt; *** EPrints developers Forum: </font></tt><tt><font size="2"><a href="http://forum.eprints.org/***">http://forum.eprints.org/***</a></font></tt><tt><font size="2">&nbsp;Options:<br>
&gt; </font></tt><tt><font size="2"><a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a></font></tt><tt><font size="2"><br>
&gt; *** Archive: </font></tt><tt><font size="2"><a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a></font></tt><tt><font size="2"><br>
&gt; *** EPrints community wiki: </font></tt><tt><font size="2"><a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a></font></tt><tt><font size="2"><br>
&gt; *** EPrints developers Forum: </font></tt><tt><font size="2"><a href="http://forum.eprints.org/">http://forum.eprints.org/</a></font></tt><tt><font size="2"><br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
&gt; <br>
<br>
*** Options: </font></tt><tt><font size="2"><a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a></font></tt><tt><font size="2"><br>
*** Archive: </font></tt><tt><font size="2"><a href="http://www.eprints.org/tech.php/">http://www.eprints.org/tech.php/</a></font></tt><tt><font size="2"><br>
*** EPrints community wiki: </font></tt><tt><font size="2"><a href="http://wiki.eprints.org/">http://wiki.eprints.org/</a></font></tt><tt><font size="2"><br>
*** EPrints developers Forum: </font></tt><tt><font size="2"><a href="http://forum.eprints.org/">http://forum.eprints.org/</a></font></tt><tt><font size="2"><br>
</font></tt><br>
<br>
</body></html>