<html><head><meta http-equiv="Content-Type" content="text/html charset=iso-8859-1"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><br><div><br><div>Begin forwarded message:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px;"><span style="font-family:'Helvetica'; font-size:medium; color:rgba(0, 0, 0, 1.0);"><b>From: </b></span><span style="font-family:'Helvetica'; font-size:medium;">Anurag Acharya &lt;<a href="mailto:acha@google.com">acha@google.com</a>&gt;<br></span></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px;"><span style="font-family:'Helvetica'; font-size:medium; color:rgba(0, 0, 0, 1.0);"><b>Subject: </b></span><span style="font-family:'Helvetica'; font-size:medium;"><b>Re: [EP-tech] Are Closed Access Deposits Indexed by Google Scholar?</b><br></span></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px;"><span style="font-family:'Helvetica'; font-size:medium; color:rgba(0, 0, 0, 1.0);"><b>Date: </b></span><span style="font-family:'Helvetica'; font-size:medium;">5 March, 2013 10:30:35 PM EST<br></span></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px;"><span style="font-family:'Helvetica'; font-size:medium; color:rgba(0, 0, 0, 1.0);"><b>To: </b></span><span style="font-family:'Helvetica'; font-size:medium;">Stevan Harnad &lt;<a href="mailto:harnad@ecs.soton.ac.uk">harnad@ecs.soton.ac.uk</a>&gt;<br></span></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px;"><span style="font-family:'Helvetica'; font-size:medium; color:rgba(0, 0, 0, 1.0);"><b>Cc: </b></span><span style="font-family:'Helvetica'; font-size:medium;"><a href="mailto:eprints-tech@ecs.soton.ac.uk">eprints-tech@ecs.soton.ac.uk</a>, Couture Marc &lt;<a href="mailto:marc.couture@teluq.ca">marc.couture@teluq.ca</a>&gt;<br></span></div><br><div dir="ltr">Hi Marc: I took a quick look at the examples you mentioned. I noticed couple of issues:<div><br></div><div>First things first, you are explicitly asking for these pages to not be indexed. For the two examples you mentioned:</div>
<div>view-source:<a href="http://www.archipel.uqam.ca/4254/">http://www.archipel.uqam.ca/4254/</a><br></div><div>&lt;meta name="robots" content="noindex,nofollow" /&gt;</div><div><br></div><div>view-source:<a href="http://www.archipel.uqam.ca/4252/">http://www.archipel.uqam.ca/4252/</a><br>
</div><div>&lt;meta name="robots" content="noindex,nofollow" /&gt;<br></div><div><br></div><div style="">A noindex robots metatag on an html page asks web search services to not index the page.</div><div style="">
<br></div><div style="">Second, I don't know if this is an old version of eprints or a custom repository but looks like it doesn't include the machine-readable bibliographic metadata that eprints 3.0 and later embed using metatags. Eg:&nbsp;</div>
<div style="">view-source:<a href="http://eprints.soton.ac.uk/349474/">http://eprints.soton.ac.uk/349474/</a><br></div><div style=""><br></div><div style=""><div>&nbsp;&lt;meta name="eprints.creators_name" content="Ohka, Seii" /&gt;</div>
<div>&lt;meta name="eprints.creators_name" content="Sakai, Mai" /&gt;</div><div>&lt;meta name="eprints.creators_name" content="Bohnert, Stephanie" /&gt;</div><div>&lt;meta name="eprints.creators_name" content="Igarashi, Hiroko" /&gt;</div>
<div>&lt;meta name="eprints.creators_name" content="Deinhardt, Katrin" /&gt;</div><div>&lt;meta name="eprints.creators_name" content="Schiavo, Giampietro" /&gt;</div><div>&lt;meta name="eprints.creators_name" content="Nomoto, Akio" /&gt;</div>
<div>[...]</div><div><br></div><div style="">If you are using an older version of eprints, I would recommend upgrading to a version later than 3.0. If you are using a different repository software, I would recommend <a href="http://roar.eprints.org/help/google_scholar.html">http://roar.eprints.org/help/google_scholar.html</a> and&nbsp;<a href="http://scholar.google.com/intl/en/scholar/inclusion.html">http://scholar.google.com/intl/en/scholar/inclusion.html</a></div>
<div style=""><br></div><div style="">cheers,</div><div style="">anurag</div><div style=""><br></div></div><div style=""><br></div><div style=""><br></div><div style=""><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">
On Tue, Mar 5, 2013 at 5:17 AM, Stevan Harnad <span dir="ltr">&lt;<a href="mailto:harnad@ecs.soton.ac.uk" target="_blank">harnad@ecs.soton.ac.uk</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 ..8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word"><div>On 2013-03-05, at 5:12 AM, Tim Brody &lt;<a href="mailto:tdb2@ecs.soton.ac.uk" target="_blank">tdb2@ecs.soton.ac.uk</a>&gt; wrote:</div><div><div><br><blockquote type="cite">On Mon, 4 Mar 2013 15:23:06 -0500, Stevan Harnad &lt;<a href="mailto:harnad@ecs.soton.ac.uk" target="_blank">harnad@ecs.soton.ac.uk</a>&gt;<br>
wrote:<blockquote type="cite">I have been told that closed access deposits for<br><a href="http://www.archipel.uqam.ca/" target="_blank">http://www.archipel.uqam.ca</a> are not being indexed by Google Scholar: Is<br>there any way around this?<br>
<br>(I mean the metadata, of course, not the full-text, which I know is<br>unharvestable till access is re-set as OA).<br></blockquote><br>There's no reason that the metadata pages shouldn't be indexed, but I don't<br>
think (?) Google Scholar will list metadata-only records from repositories.<br><br>A specific example would be useful.<br></blockquote><div><br></div><div>It's bad news (for the Button) if GS does not index the metadata of Closed Access deposits. (GS certainly indexes plenty of papers that do not have a free full-text version on the web).</div>
<div><br></div><div>Could this (if it's true) be fixed by optimizing the way an EPrints IR presents itself to google and GS (levels of embedding or something like that)?&nbsp;I seem to remember Les saying that the depth of documents was important.</div>
<div><br></div><div>A DSpace IR, Orbi, has 50% Closed Access contents (for example,&nbsp;<a href="http://orbi.ulg.ac.be/browse?type=datepublished&amp;rpp=20&amp;value=2012" target="_blank">here</a>).&nbsp;</div><div>These are all picked up by Google, for example this one:&nbsp;"Tubulin isoforms identified in the brain by MALDI in-source decay"</div>
<div>but they appear very late in the Google hit list (especially for much-sited or multi-cited papers)</div><div><i>and the Orbi version does not seem to be picked up by GS at all.</i></div><div><br></div><div>This is extremely important, because it affects the efficacy of the Button, and thereby the power of an immediate-deposit mandate (and the incentive to adopt one).</div>
<div><br></div><div>Is there any way to address this problem directly in EPrints (plus advice for our cousins in DSpace)?</div><div><br></div><div>Many thanks,</div><div><br></div><div>Stevan</div><div><br></div><blockquote type="cite">
<br></blockquote><br></div><div><blockquote type="cite"><div style="margin:0px"><b>From:&nbsp;</b>Couture Marc &lt;<a href="mailto:marc.couture@teluq.ca" target="_blank">marc.couture@teluq.ca</a>&gt;<br></div><div style="margin:0px">
<b>Subject:&nbsp;</b><b>RE: [EP-tech] Are Closed Access Deposits Indexed by Google Scholar?</b><br></div><div style="margin:0px"><b>Date:&nbsp;</b>4 March, 2013 6:17:13 PM EST<br></div><div style="margin:0px"><b>To:&nbsp;</b>Stevan Harnad &lt;<a href="mailto:harnad@ecs.soton.ac.uk" target="_blank">harnad@ecs.soton.ac.uk</a>&gt;, Leslie Carr &lt;<a href="mailto:lac@ecs.soton.ac.uk" target="_blank">lac@ecs.soton.ac.uk</a>&gt;<br>
</div><br><div>Hi,<br><br>My belief that Google / Scholar doesn't index closed access documents (more precisely, the HTML page with the metadata) is based upon a simple check with two closed access documents in Archipel :<br>
<br>1. <a href="http://www.archipel.uqam.ca/4252" target="_blank">http://www.archipel.uqam.ca/4252</a>&nbsp;<br><br>This is the manuscript of a published article (Title : So into it they forget what time it is?)<br><br>If I put the title (between quotes) in Google or Google Scholar, all I see is the published (toll access) version :<br>
<br><a href="http://www.igi-global.com/chapter/into-they-forget-time/67430" target="_blank">http://www.igi-global.com/chapter/into-they-forget-time/67430</a>&nbsp;<br><br>2. <a href="http://www.archipel.uqam.ca/4254" target="_blank">http://www.archipel.uqam.ca/4254</a>&nbsp;<br>
<br>The title is: Discretionary power of project managers in knowledge intensive firms and gender issues<br><br>Again, Google Scholar finds only the published version (Google doesn't even find it):<br><br><a href="http://onlinelibrary.wiley.com/doi/10.1002/cjas.147/abstract" target="_blank">http://onlinelibrary.wiley.com/doi/10.1002/cjas.147/abstract</a>&nbsp;<br>
<br>On the same results page, one sees another paper, available in open acces in Archipel, citing this one.<br><br>Both manuscripts have been in Archipel for more than one year (deposit date: Nov 2011).<br><br><br>Marc Couture<br>
<br></div></blockquote></div><br></div></div></blockquote></div><br></div>
</blockquote></div><br></body></html>