<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body>
<div style="padding-bottom: 10px; padding-top: 5px;">
<div style="padding:12px; border:1px solid #8D3970; background-color:#F7F9FA; color:#8D3970; font-size:14px; line-height:22px; font-family: Calibri, Arial, Helvetica, sans-serif;">
<strong>CAUTION:</strong> This e-mail originated outside the University of Southampton.
</div>
</div>
<div>
<div dir="ltr">Morning!
<div><br>
</div>
<div>Apologies for the slow reply. Firstly Andy and John thank you so much for your advice. It was really helpful&nbsp;and we DID manage to get a harvest with our RT2! As far as success goes that was all that could be hoped for. Immediately&nbsp;after that some more
 pressing work came up with our Data Repository which has resulted in it needing to be upgraded with some immediacy.</div>
<div><br>
</div>
<div>Andy; I am going to have to return to this and fully wrap my head around it. It seems clear to me that some attention to our OAI config is needed as it appears to be quite messy and this advice is going to be really helpful&nbsp;with that.</div>
<div><br>
</div>
<div>John; I had a look in the logs to see if anyone was harvesting using &quot;Department&quot; and realised that only our theses use that field and could find no clear evidence of it being used for harvesting. I've removed it on Test and will probably do the same on
 Live when the time comes. I suppose the true test will be when somebody contacts me saying they're unable to harvest our content. At which point I'll gently point them towards &quot;Type&quot; hopefully.</div>
<div><br>
</div>
<div>Thank you again for the help!</div>
<div><br>
</div>
<div>James</div>
</div>
<br>
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">On Thu, Jan 20, 2022 at 2:30 PM John Salter &lt;<a href="mailto:J.Salter@leeds.ac.uk">J.Salter@leeds.ac.uk</a>&gt; wrote:<br>
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div lang="EN-GB">
<div class="gmail-m_-448663463639796880WordSection1">
<p class="MsoNormal"><span style="color:rgb(31,73,125)">Hi James,<br>
That's an 'interesting' set setup. The default (commented-out) offering for that set doesn't have the department.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">At a guess, it might have been added to create some disambiguation between authors of the same name, but in different departments - but that makes no sense, as it's using their IDs, not names.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><br>
<br>
<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">To answer your question - it looks like a data-quality issue.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">The following are *<b>not</b>* the same thing:<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">setName&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Person = Molecular and
<span style="background:yellow">C</span>linical <span style="background:yellow">P</span>harmacology<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">setSpec&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 706572736F6E3D4D6F6C6563756C617220616E6420<span style="background:yellow">43</span>6C696E6963616C20<span style="background:yellow">50</span>6861726D61636F6C6F6779<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">setName&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Person = Molecular and
<span style="background:yellow">c</span>linical <span style="background:yellow">p</span>harmacology<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">setSpec&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 706572736F6E3D4D6F6C6563756C617220616E6420<span style="background:yellow">63</span>6C696E6963616C20<span style="background:yellow">70</span>6861726D61636F6C6F6779<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">setName&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Person =
<span style="background:yellow">Department of</span> Molecular and Clinical Pharmacology<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">setSpec&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 706572736F6E3D4<span style="background:yellow">465706172746D656E74206F6620</span>4D6F6C6563756C617220616E6420436C696E6963616C20506861726D61636F6C6F6779<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">NB the 'setSpec' is just the name represented as characters<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">My guidance would be:<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">- feed your weblogs through a tool to analyse the OAI-PMH requests, and see who's using what. If no one is using the 'person' sets, I think removing their definitions would speed your OAI-PMH interface
 up. I guess they were added for a reason at some point though - hopefully someone somewhere will know something about them!<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">- (possibly - based on the above) remove the 'Department' from that set definition.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">- add another set for 'divisions' based on the 'divisions' field you are using<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">- on your test server add some sets for testing (see Andy's email) - this is a very useful approach for testing RT2
</span><span style="font-family:Wingdings;color:rgb(31,73,125)">J</span><span style="color:rgb(31,73,125)"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">Cheers,<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)">John<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125)"><u></u>&nbsp;<u></u></span></p>
<div>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(225,225,225);padding:3pt 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US">From:</span></b><span lang="EN-US"> <a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk" target="_blank">
eprints-tech-bounces@ecs.soton.ac.uk</a> [mailto:<a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk" target="_blank">eprints-tech-bounces@ecs.soton.ac.uk</a>]
<b>On Behalf Of </b>Andy Reid via Eprints-tech<br>
<b>Sent:</b> 20 January 2022 13:21<br>
<b>To:</b> <a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>; James Kerwin &lt;<a href="mailto:jkerwin2101@gmail.com" target="_blank">jkerwin2101@gmail.com</a>&gt;<br>
<b>Subject:</b> Re: [EP-tech] OAI Harvesting<u></u><u></u></span></p>
</div>
</div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
<div>
<div style="border:1pt solid rgb(141,57,112);padding:9pt">
<p class="MsoNormal" style="line-height:16.5pt;background:rgb(247,249,250)"><strong><span style="font-size:10.5pt;font-family:Calibri,sans-serif;color:rgb(141,57,112)">CAUTION:</span></strong><span style="font-size:10.5pt;color:rgb(141,57,112)"> This e-mail
 originated outside the University of Southampton. <u></u><u></u></span></p>
</div>
</div>
<div>
<p class="MsoNormal"><span>Hi James,<u></u><u></u></span></p>
<p class="MsoNormal"><span>When I was setting up RT2, I ignored the predefined sets in Elements, and created custom sets for testing and for production. I set up a cfg.d/<a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fzzz_symplectic_oai.pl%2F&amp;data=04%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C622c9c406ad2432f063108d9ea10004e%7C4a5378f929f44d3ebe89669d03ada9d8%7C0%7C0%7C637798177733391282%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C3000&amp;sdata=lPJsgZps9GnrdJZiGfm0Xod9q5Tc%2F%2F%2BvW%2FGBXfJGr3A%3D&amp;reserved=0" originalSrc="http://zzz_symplectic_oai.pl/" shash="V5GLoHh+CUCUXLn6RQ9Rk+8ptrqZMh49v6+iBr6qANOAZj1gFTJ+8wBMqLZB2NNPrY4ZMajnQ0RA7G1vkQrgdmdltOsapj/9QavgrxSy6eBO3Fw1FIM9iyv0V8brDSITqJP7wwEkEuwoGOVJauc9ZIUOyBMvDnGBxozPTVKA53Y=" target="_blank">zzz_symplectic_oai.pl</a>, and split
 the production harvest into full-text-public, full-text-restricted, and full-text-none (metadata-only). I forget the thinking behind that split, but it does cover everything, I believe.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>I’m not sure if $c-&gt;{oai}-&gt;{custom_sets}} is something that is set up and parsed by default, or if you might need to enable that first. It was there, and I could edit it, so I did.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>##############################&nbsp; PRODUCTION SETS ####################################################<u></u><u></u></span></p>
<p class="MsoNormal"><span>#<u></u><u></u></span></p>
<p class="MsoNormal"><span>#&nbsp; These are used in earnest by Symplectic Repository Tools 2&nbsp;&nbsp;&nbsp;
<u></u><u></u></span></p>
<p class="MsoNormal"><span>#<u></u><u></u></span></p>
<p class="MsoNormal"><span>####################################################################################################<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>push @{$c-&gt;{oai}-&gt;{custom_sets}}, { spec =&gt; &quot;full_text_none&quot;, name =&gt; &quot;full_text_none&quot;, filters =&gt; [<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;full_text_status&quot; ], value=&gt;&quot;none&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;eprint_status&quot; ], value=&gt;&quot;archive&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },&nbsp; -- live records only, not in review or deleted<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>] };<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>push @{$c-&gt;{oai}-&gt;{custom_sets}}, { spec =&gt; &quot;full_text_public&quot;, name =&gt; &quot;full_text_public&quot;, filters =&gt; [<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;full_text_status&quot; ], value=&gt;&quot;public&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;eprint_status&quot; ], value=&gt;&quot;archive&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>] };<u></u><u></u></span></p>
<p class="MsoNormal"><span>push @{$c-&gt;{oai}-&gt;{custom_sets}}, { spec =&gt; &quot;full_text_restricted&quot;, name =&gt; &quot;full_text_restricted&quot;, filters =&gt; [<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;full_text_status&quot; ], value=&gt;&quot;restricted&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;eprint_status&quot; ], value=&gt;&quot;archive&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>] };<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>For testing I had a variety of scratch sets, using named users, years, or lists of Eprint IDs:
<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>e.g.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>NAMED USER:<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>push @{$c-&gt;{oai}-&gt;{custom_sets}}, { spec =&gt; &quot;symplectic_andy_email&quot;, name =&gt; &quot;symplectic_andy_email&quot;, filters =&gt; [<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;creators_id&quot; ], value=&gt;&quot;andy REID lshtm&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ALL&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>] };<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>SPECIFIC RECORDS:<u></u><u></u></span></p>
<p class="MsoNormal"><span>push @{$c-&gt;{oai}-&gt;{custom_sets}}, { spec =&gt; &quot;symplectic_test&quot;, name =&gt; &quot;symplectic_test&quot;, filters =&gt; [<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;eprintid&quot; ], value=&gt;&quot;<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4645869 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;4645797 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;4645491 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;4645719 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;4645785<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4363558<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4398757<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4433720 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;3451639 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;2783042 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;19260<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1924927 <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;333704<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3172489<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3174428<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;1878135<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4646586<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4645489<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4647623<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4647670<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&quot;, <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;match=&gt;&quot;IN&quot;, <u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>] };<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>#4645869 = article, OA, 2017<u></u><u></u></span></p>
<p class="MsoNormal"><span>#4645797 = conference item, 2017<u></u><u></u></span></p>
<p class="MsoNormal"><span>#4645491 = thesis, 2017<u></u><u></u></span></p>
<p class="MsoNormal"><span>#4645719 = monograph<u></u><u></u></span></p>
<p class="MsoNormal"><span>#4645458 = other, OA guide , library<u></u><u></u></span></p>
<p class="MsoNormal"><span>#4363558 = book section [now recoded to article]<u></u><u></u></span></p>
<p class="MsoNormal"><span>#4398757 = [Accepted manuscript] of 4363558<u></u><u></u></span></p>
<p class="MsoNormal"><span>#3451639 = podcast<u></u><u></u></span></p>
<p class="MsoNormal"><span>#2783042 = video<u></u><u></u></span></p>
<p class="MsoNormal"><span>#2869451 = dataset<u></u><u></u></span></p>
<p class="MsoNormal"><span>#19260 = patent<u></u><u></u></span></p>
<p class="MsoNormal"><span>#1924927 = image<u></u><u></u></span></p>
<p class="MsoNormal"><span>#333704 = artefact<u></u><u></u></span></p>
<p class="MsoNormal"><span># 4646586&nbsp; exhibition<u></u><u></u></span></p>
<p class="MsoNormal"><span>#<a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fresearchonline.lshtm.ac.uk%2F4645489%2F&amp;data=04%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C622c9c406ad2432f063108d9ea10004e%7C4a5378f929f44d3ebe89669d03ada9d8%7C0%7C0%7C637798177733391282%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C3000&amp;sdata=p71%2FuXEpT6nmpXqeOZxfmidYnDfa7q4LgJxj27YdqIw%3D&amp;reserved=0" originalSrc="http://researchonline.lshtm.ac.uk/4645489/" shash="r4k8ehUN6EXn+2frPNBh8H/x2aX3j0Hus7te/PU7pU1Ua+/n+tE7l9jMOIBGg/SNUsoq58WA1oh7OR8mt3ka3Qhw+TbyUfAmV6SwMRFREUN/ZWl+Tm5LfOmS/muAfLw8dpIwg8n0Tc0jA8aiQr2ohcIRUlj6xPpIHTw3t64fztU=" target="_blank">http://researchonline.lshtm.ac.uk/4645489/</a>&nbsp; Teaching Resource<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>#3172489 = [Accepted Manuscript]<u></u><u></u></span></p>
<p class="MsoNormal"><span>#3174428 = Final version of above<u></u><u></u></span></p>
<p class="MsoNormal"><span>#1878135/ = [Inc; Grosskurth, H;]&nbsp; Manually added author&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>MULTIPLE FILTERS:<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>push @{$c-&gt;{oai}-&gt;{custom_sets}}, { spec =&gt; &quot;full_text_public_live_patel2016&quot;, name =&gt; &quot;full_text_public_live_patel2016&quot;, filters =&gt; [<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;eprint_status&quot; ], value=&gt;&quot;archive&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;full_text_status&quot; ], value=&gt;&quot;public&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;view_date&quot; ], value=&gt;&quot;2016&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ANY&quot; },&nbsp;
<u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; { meta_fields =&gt; [ &quot;creators_id&quot; ], value=&gt;&quot;vikram patel lshtm&quot;, match=&gt;&quot;IN&quot;, merge=&gt;&quot;ALL&quot; },&nbsp;&nbsp; -- matches
<a href="mailto:Vikram.patel@lshtm.ac.uk" target="_blank">Vikram.patel@lshtm.ac.uk</a><u></u><u></u></span></p>
<p class="MsoNormal"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <u></u><u></u></span></p>
<p class="MsoNormal"><span>] };<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>Hope that is useful<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span>Andy&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u>&nbsp;<u></u></span></p>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(181,196,223);padding:3pt 0cm 0cm">
<p class="MsoNormal"><b><span style="font-size:12pt;color:black">From: </span></b><span style="font-size:12pt;color:black">&lt;<a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk" target="_blank">eprints-tech-bounces@ecs.soton.ac.uk</a>&gt; on behalf of James Kerwin
 via Eprints-tech &lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>&gt;<br>
<b>Reply to: </b>&quot;<a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>&quot; &lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>&gt;, James Kerwin &lt;<a href="mailto:jkerwin2101@gmail.com" target="_blank">jkerwin2101@gmail.com</a>&gt;<br>
<b>Date: </b>Thursday, 20 January 2022 at 12:49<br>
<b>To: </b>&quot;<a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>&quot; &lt;<a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>&gt;<br>
<b>Subject: </b>[EP-tech] OAI Harvesting<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal"><strong><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black">*** This message originated outside LSHTM ***</span></strong><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black"><u></u><u></u></span></p>
<div class="MsoNormal" align="center" style="text-align:center">
<hr size="1" width="100%" align="center">
</div>
</div>
<div>
<div style="border:1pt solid rgb(141,57,112);padding:9pt">
<p class="MsoNormal" style="line-height:16.5pt;background:rgb(247,249,250)"><strong><span style="font-size:10.5pt;font-family:Calibri,sans-serif;color:rgb(141,57,112)">CAUTION:</span></strong><span style="font-size:10.5pt;color:rgb(141,57,112)"> This e-mail
 originated outside the University of Southampton. <u></u><u></u></span></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Hi All,<u></u><u></u></p>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">We're setting up RT2 (Elements) at the moment and working through some bugs. This is not a specific EPrints problem, but I'm hoping the collective wisdom of those here can provide some clarity...<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">In our OAI ListSets pages it has become apparent that we have duplicate sets. We appear to have a peculiar setup whereby we have :<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">$oai-&gt;{sets} = [<br>
{ id=&gt;&quot;person&quot;, allow_null=&gt;0, fields=&gt;&quot;contributors_id/editors_id/department&quot; }<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">This puts department in the person set. We don't even use department in our current EPrints records (we have Divisions which I've spoken about a LOT previously). What I'm curious about is:<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">1) How do duplicate sets come about? I thought the idea of a set would be if items have the same value they would be in the same set.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">2) Is there any easy way to identify the duplicate sets? Somebody from Symplectic that I'm working with was kind enough to point them out on our live repository and sure enough if I ctrl+f for &quot;Molecular and Clinical Pharmacology&quot; on
<a href="https://eur03.safelinks.protection.outlook.com/?url=https%3A%2F%2Flivrepository.liverpool.ac.uk%2Fcgi%2Foai2%3Fverb%3DListSets&amp;data=04%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C622c9c406ad2432f063108d9ea10004e%7C4a5378f929f44d3ebe89669d03ada9d8%7C0%7C0%7C637798177733391282%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C3000&amp;sdata=BybiCeUCooxDqhD4FFHlpNNTEGSitlHldJtfaiyWmw4%3D&amp;reserved=0" originalSrc="https://livrepository.liverpool.ac.uk/cgi/oai2?verb=ListSets" shash="L6C6MhSqkyNFf3AP5SiQsMk+OLRkneav11dQbdSUYMSSkPD12ApFEOQv7NnWgYuHcbE/vuBvMl+xmu0/j7Z9en97WpZ6Ptt07F1MM4AWhdm2wTfxfXSyQkXG0kNbKO8E1P33HrIuhJLtmX8flR3Wx2m1d1oheGvar13cCmc6QNY=" target="_blank">
https://livrepository.liverpool.ac.uk/cgi/oai2?verb=ListSets</a> it appears twice.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">I've tried to learn about OAI, but it does unfortunately make my brain scream because I just do not understand it properly.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u>&nbsp;<u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">James<u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
</div>
</body>
</html>