<div dir="ltr"><div dir="ltr"><div dir="ltr">He David and John,<br><div><br></div><div>I&#39;ve taken a look at the symplectic_merge and symplectic_pids table, and using by budding skills of divination I couldn&#39;t find anything out of sorts in there - so far as I can tell. Although in trying to fix this with multiple re-deposits this one record has a load of different EPrints IDs.</div><div><br></div><div>It appears to be as John said. I&#39;ve managed to clean the record up by fiddling with the document and file tables and moving some files around. Everything appears to be working...</div><div><br></div><div>John, thank you for the piece of SQL. It appears this is isn&#39;t a huge problem, but there are other instances that I&#39;m now at least aware of. I&#39;ll put a ticket in with Symplectic. If you do have a solution it would be brilliant, but out of principle I think Symplectic should provide the solution to their customers. Capitalists shouldn&#39;t be depending on an open source group to fix their code. Anyway, I don&#39;t want to get too political...</div><div><br></div><div>Thank you both for your help.</div><div><br></div><div>Thanks,</div><div>James</div></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, May 16, 2019 at 9:49 AM John Salter &lt;<a href="mailto:J.Salter@leeds.ac.uk">J.Salter@leeds.ac.uk</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi James,<br>
Yes - and I&#39;ve submitted a bug report to Symplectic - with a fix for their connector - which they&#39;ve never rolled out *sigh*.<br>
<br>
When two items are merged, and initially they both have documents in folder &#39;01&#39;, all these then get put into the &#39;surviving EPrint&#39;s &#39;01&#39; directory.<br>
Worse still, if both items have a file of the same name e.g. Doc1.pdf (but they are different files), one of them will overwrite the other - and you have data-loss :o|<br>
<br>
You can see how many things are affected by this with the following query:<br>
SELECT   eprintid, pos, count(*) as c FROM   document GROUP BY   eprintid, pos HAVING c &gt; 1;<br>
<br>
The issue is in Symplectic/RepoProcess/MergeManager.pm - and a call to:<br>
        my $new_doc = $doc-&gt;clone($target);<br>
This clone doesn&#39;t reset the &#39;pos&#39; - so you get the results reported.<br>
<br>
I&#39;ll put a gist together with the changes needed to resolve this.<br>
<br>
Feel free to log it as a ticket with Symplectic...<br>
<br>
Cheers,<br>
John<br>
<br>
-----Original Message-----<br>
From: <a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk" target="_blank">eprints-tech-bounces@ecs.soton.ac.uk</a> [mailto:<a href="mailto:eprints-tech-bounces@ecs.soton.ac.uk" target="_blank">eprints-tech-bounces@ecs.soton.ac.uk</a>] On Behalf Of Newman D.R. via Eprints-tech<br>
Sent: 16 May 2019 09:28<br>
To: <a href="mailto:eprints-tech@ecs.soton.ac.uk" target="_blank">eprints-tech@ecs.soton.ac.uk</a>; James Kerwin &lt;<a href="mailto:jkerwin2101@gmail.com" target="_blank">jkerwin2101@gmail.com</a>&gt;<br>
Subject: Re: [EP-tech] EPrints/Elements Merge Problems<br>
<br>
Hi James,<br>
<br>
Based on some experience with this it can be due to the symplectic_pids<br>
table in EPrints getting out of sync.  I have in the past had to make<br>
manual corrections to fix this.  It has never been clear to me what<br>
caused the issue, as I only have access to the EPrints side.<br>
<br>
I would take a look in this EPrints database table.  It has three IDs<br>
two from Symplectic and one from EPrints.  A record with no outstanding<br>
merge issues should have the same two Symplectic IDs and the associated<br>
EPrint ID.  Sometimes I have not even been able to find the record I<br>
need in this table based on a lookup against either the EPrint or<br>
Symplectic ID.  Tell me what you find and I maybe able to advise<br>
further or confirm whether this is or is not the issue you are<br>
experiencing.<br>
<br>
Regards<br>
<br>
David Newman<br>
<br>
On Thu, 2019-05-16 at 09:18 +0100, James Kerwin via Eprints-tech wrote:<br>
&gt; Hi All,<br>
&gt;<br>
&gt; This may be a question for the Symplectic list, but on the off-chance<br>
&gt; anybody has experienced similar problems... Has anybody had trouble<br>
&gt; with merging records in Elements and the result in EPrints being a<br>
&gt; complete mess?<br>
&gt;<br>
&gt; A record was merged recently and the results in EPrints are two<br>
&gt; documents in the same folder on the server (where the file download<br>
&gt; link points two).<br>
&gt;<br>
&gt; For example, there is usually one file per bottom level directory:<br>
&gt;<br>
&gt; Dir 01 = file1.pdf<br>
&gt; Dir 02 = file2.pdf<br>
&gt;<br>
&gt; and so on.<br>
&gt;<br>
&gt; I&#39;m getting:<br>
&gt;<br>
&gt; Dir 01 = file1.pdf, file2.pdf<br>
&gt; Dir02 = file3.pdf<br>
&gt;<br>
&gt; Also the files showing Elements seem to be duplicating themselves and<br>
&gt; keeps changing to &quot;deposit incomplete&quot; Always one more of the<br>
&gt; duplicated file in Elements than is appearing in EPrints.<br>
&gt;<br>
&gt; I know I can tidy this up in EPrints, but I&#39;d like to stop it<br>
&gt; happening altogether.<br>
&gt;<br>
&gt; Thanks,<br>
&gt; James<br>
&gt; *** Options: <a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-" rel="noreferrer" target="_blank">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-</a><br>
&gt; tech<br>
&gt; *** Archive: <a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.eprints.org%2Ftech.php%2F&amp;data=01%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C61b5b00595bb42db929d08d6d9f0b391%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;sdata=3jQ1MsZJifnqcgndQ6hpdoA76yV6xwzfVQBiK6wC%2FDg%3D&amp;reserved=0" originalSrc="http://www.eprints.org/tech.php/" shash="PYiEOXibWgCSVaaQZzv5r9ojEy1CuHDGDDusXaAJkY2MvP329TfRikbd22Tnb3GmAxAr3wVNVFk4CRLuLJ6/jkGOs/Qr067Qr38qK888XdM5fLtj9e0qul7kfuaS2/CqYQU17WK4JGyAt/Z8VTSM6JScFFLNPxCibH+w+loceJ0=" rel="noreferrer" target="_blank">https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.eprints.org%2Ftech.php%2F&amp;amp;data=01%7C01%7C%7Cd53022b90d27459e88c208d6d9d878a3%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;amp;sdata=k9RapSd7ddVo7%2BFhlqhADhT53Ra9%2FRwHWaXhLonT5aM%3D&amp;amp;reserved=0</a><br>
&gt; *** EPrints community wiki: <a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwiki.eprints.org%2F&amp;data=01%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C61b5b00595bb42db929d08d6d9f0b391%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;sdata=m1uCX8GgFFw6x56VdzQToU3TnkQKVEC5zrh1nge5zwk%3D&amp;reserved=0" originalSrc="http://wiki.eprints.org/" shash="shE5ip86mmF6uHnecxuxEx7ipmcu824fcOCg+6gwPvzVGQGUY3rZL9zbEYQiiGDkQTp51HkY6Ejs0dBj0lEViVRc2SxAeSYyI7ffcvOwNSn0Jzlo1Hj0zSMc7vO7Wbh0suaYKi0x9ZEfgwBseG+bv8j8q9UPlH4taQlczq/i5eQ=" rel="noreferrer" target="_blank">https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwiki.eprints.org%2F&amp;amp;data=01%7C01%7C%7Cd53022b90d27459e88c208d6d9d878a3%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;amp;sdata=6vHCSlBvgz9sv3jZGhvsmwKJn4all8tCD2bc44fuxpo%3D&amp;amp;reserved=0</a><br>
&gt; *** EPrints developers Forum: <a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fforum.eprints.org%2F&amp;data=01%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C61b5b00595bb42db929d08d6d9f0b391%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;sdata=83a139oa72sZmoQL21MszIjFjwTyZdbLr0ASLb1Qvso%3D&amp;reserved=0" originalSrc="http://forum.eprints.org/" shash="xNM+cnQDdOn04XO+03dEM23FJCJ9Z3u3CpH5orz45Df71hYpeHDvpHzfaLJcYZemmLQkE0+RZNQOdOyIkGskVD5xt3ROpuKsfyU3VlOwAo6VKM7uddWp9V0mjDuT0notV9u+VT9lFUlASrllz1haeZ+n3XrgFKHrIu7Nu2BIfZs=" rel="noreferrer" target="_blank">https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fforum.eprints.org%2F&amp;amp;data=01%7C01%7C%7Cd53022b90d27459e88c208d6d9d878a3%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;amp;sdata=RaBQEyELw4X71EVgu7B9nnSm090fFQFEc%2FBO9mQaK%2Fk%3D&amp;amp;reserved=0</a><br>
<br>
*** Options: <a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech" rel="noreferrer" target="_blank">http://mailman.ecs.soton.ac.uk/mailman/listinfo/eprints-tech</a><br>
*** Archive: <a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.eprints.org%2Ftech.php%2F&amp;data=01%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C61b5b00595bb42db929d08d6d9f0b391%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;sdata=3jQ1MsZJifnqcgndQ6hpdoA76yV6xwzfVQBiK6wC%2FDg%3D&amp;reserved=0" originalSrc="http://www.eprints.org/tech.php/" shash="PYiEOXibWgCSVaaQZzv5r9ojEy1CuHDGDDusXaAJkY2MvP329TfRikbd22Tnb3GmAxAr3wVNVFk4CRLuLJ6/jkGOs/Qr067Qr38qK888XdM5fLtj9e0qul7kfuaS2/CqYQU17WK4JGyAt/Z8VTSM6JScFFLNPxCibH+w+loceJ0=" rel="noreferrer" target="_blank">http://www.eprints.org/tech.php/</a><br>
*** EPrints community wiki: <a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwiki.eprints.org%2F&amp;data=01%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C61b5b00595bb42db929d08d6d9f0b391%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;sdata=m1uCX8GgFFw6x56VdzQToU3TnkQKVEC5zrh1nge5zwk%3D&amp;reserved=0" originalSrc="http://wiki.eprints.org/" shash="shE5ip86mmF6uHnecxuxEx7ipmcu824fcOCg+6gwPvzVGQGUY3rZL9zbEYQiiGDkQTp51HkY6Ejs0dBj0lEViVRc2SxAeSYyI7ffcvOwNSn0Jzlo1Hj0zSMc7vO7Wbh0suaYKi0x9ZEfgwBseG+bv8j8q9UPlH4taQlczq/i5eQ=" rel="noreferrer" target="_blank">http://wiki.eprints.org/</a><br>
*** EPrints developers Forum: <a href="https://eur03.safelinks.protection.outlook.com/?url=http%3A%2F%2Fforum.eprints.org%2F&amp;data=01%7C01%7Ceprints-tech%40ecs.soton.ac.uk%7C61b5b00595bb42db929d08d6d9f0b391%7C4a5378f929f44d3ebe89669d03ada9d8%7C0&amp;sdata=83a139oa72sZmoQL21MszIjFjwTyZdbLr0ASLb1Qvso%3D&amp;reserved=0" originalSrc="http://forum.eprints.org/" shash="xNM+cnQDdOn04XO+03dEM23FJCJ9Z3u3CpH5orz45Df71hYpeHDvpHzfaLJcYZemmLQkE0+RZNQOdOyIkGskVD5xt3ROpuKsfyU3VlOwAo6VKM7uddWp9V0mjDuT0notV9u+VT9lFUlASrllz1haeZ+n3XrgFKHrIu7Nu2BIfZs=" rel="noreferrer" target="_blank">http://forum.eprints.org/</a><br>
</blockquote></div>