<div><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)">Hi Peter</font></div><div><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)"><br></font></div><div><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)">Assuming the same methodology as  <span style="line-height:21px">Gargouri Y, Hajjem C, Larivičre V, Gingras Y, Carr L, et al. (2010) Self-Selected or Mandated, Open Access Increases Citation Impact for Higher Quality Research. PLoS ONE 5(10): e13636. doi:10.1371/journal.pone.0013636 </span></font></div>

<div><font face="arial, helvetica, sans-serif"><span style="line-height:21px;background-color:rgb(255,255,255)">Available from: <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0013636">http://www.plosone.org/article/info:doi/10.1371/journal.pone.0013636</a></span></font></div>

<div><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)"><br></font></div><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)"><span style="line-height:21px">Quote:</span></font><div>

<font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)"><span style="line-height:21px">The full-text OA status of the articles in our sample was verified using an automated webwide search-robot</span><a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0013636#pone.0013636-Hajjem1" style="line-height:21px">[8]</a><span style="line-height:21px"> as well as an automated Google Scholar search. (Note that any OA articles that our robot missed would reduce any OA Advantage. Hence our estimate of the OA Advantage is conservative.) </span><a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0013636#pone-0013636-g001" style="line-height:21px"><strong>Figure 1</strong></a><span style="line-height:21px"> shows each of our four mandated institutions&#39; verified annual OA article deposits as a percentage of the institution&#39;s total published article output for each year based (only) on those articles published in the journals indexed by the Thomson-Reuters citation database; the resulting estimate of the overall OA mandate compliance rate is about 60%.(for publishing years 2002–2006, with the deposits up to 2009, when the analysis was conducted). Note also the robot data&#39;s confirmation of the approximately 15% baseline for spontaneous, self-selected (i.e., non-mandated) OA self-archiving among the control articles in the same journal/years</span><a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0013636#pone.0013636-Bjrk1" style="line-height:21px">[19]</a><span style="line-height:21px">.</span></font><div>

<font face="arial, helvetica, sans-serif"><span style="line-height:21px;background-color:rgb(255,255,255)"><br></span></font></div><div><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)"><span style="line-height:21px">Ref 8 is to </span><span class="creators"><span class="person_name">Hajjem, Chawki</span>, <span class="person_name">Harnad, Stevan</span> and <span class="person_name">Gingras, Yves</span></span> <span class="date">(2005)</span> <span class="title">Ten-Year Cross-Disciplinary Comparison of the Growth of Open Access and How it Increases Research Citation Impact.</span> <span class="publication"><em>IEEE Data Engineering Bulletin</em></span>, <span class="volume">28</span>, <span class="number">(4)</span>, <span class="pagerange">39-47</span>. </font></div>

<div><span style="background-color:rgb(255,255,255);font-family:arial,helvetica,sans-serif;line-height:21px">Available from: </span><font face="arial, helvetica, sans-serif" style="background-color:rgb(255,255,255)"><a href="http://eprints.soton.ac.uk/262906/">http://eprints.soton.ac.uk/262906/</a></font></div>

<div><font face="arial, helvetica, sans-serif"><span style="line-height:21px;background-color:rgb(255,255,255)"><br></span></font></div><div><font face="arial, helvetica, sans-serif"><span style="line-height:21px;background-color:rgb(255,255,255)">Quote:</span></font></div>

<div><font face="arial, helvetica, sans-serif"><span style="line-height:21px;background-color:rgb(255,255,255)"><div>The robot’s search algorithm was the following: (1) Send request to ISI database for metadata of</div><div>

article (firstauthor name and article title). (2) Send request (name, title) to: Yahoo, Metacrawler,</div><div>Vivissimo, Eo, AlltheWeb and Altavista. (3) Extract external (irrelevant) links. (4) Remove</div><div>duplicate URLs. (5) Sort URLs to process PDF and PS files first (probable full-texts). (5) Convert</div>

<div>files (PDF, PS, Latex, HTML, XML, RTF, and Word) to text. (6) Parse files to test for full-text of</div><div>reference article (name/title in first 20% of text, references in last 20%). (7) If, in parsing HTML</div>
<div>
file, title found but not full text, extract and follow links in file further as references possibly</div><div>leading to the full text (to depth of 3 levels). (8) Sort articles by discipline/journal/issue/year;</div><div>

calculate percent OA articles within each; then by discipline/journal; and finally for each</div><div>discipline. (9) Sort articles by discipline/journal/issue/year, calculate citation ratio as (OA -</div><div>NOA/NOA) within each, then by discipline/journal and finally for each discipline. (10) Exclude</div>

<div>data for all journals that are 100% OA (OA journals) from both the article counts and the citation</div><div>counts (as we are only doing within-journal comparisons for NOA journals); exclude data from</div><div>all single issues that are 100% OA (to eliminate denominators).</div>

<div><br></div></span></font><br><div class="gmail_quote">On Mon, Jul 16, 2012 at 2:20 PM, Peter Murray-Rust <span dir="ltr">&lt;<a href="mailto:pm286@cam.ac.uk" target="_blank">pm286@cam.ac.uk</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Thanks very much Alma,<br>This is very useful - I have some more questions, and would be grateful for answers if you can...<br><br><div class="gmail_quote"><div class="im"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<div><font face="Calibri, Verdana, Helvetica, Arial"><span style="font-size:12pt"><br>
The data are from Yassine Gargouri (who has used the methodology he previously used, which consists of trawling the web for openly accessible full-texts and comparing the number of those with the papers in Web of Science, which is not a perfect, but a reasonable measure of the ‘universe’ for UK researchers).<br>


</span></font></div></blockquote></div><div><br>Is this published anywhere (formally or informally) such that we can understand the details? <br>* How does he or Google know that the full-text is &quot;openly accessible&quot;? Is this by trying to read it or is there a Google flag for openly accessible?<br>


</div><div class="im"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><font face="Calibri, Verdana, Helvetica, Arial"><span style="font-size:12pt">
<br>
Previously, Yassine has done this only on a global basis, but this time he has looked for papers with at least one UK author.<br>
<br></span></font></div></blockquote></div><div>* How is this done? Does *he* analyze the author affiliations or does he get them from WoS?<br> <br></div><div class="im"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">


<div><font face="Calibri, Verdana, Helvetica, Arial"><span style="font-size:12pt">
</span></font><div><blockquote><font face="Calibri, Verdana, Helvetica, Arial"><span style="font-size:12pt">* is there an open electronic list of the publications (and their funders) so that I can access them<br>

</span></font></blockquote></div><font face="Calibri, Verdana, Helvetica, Arial"><span style="font-size:12pt"><br>
He used Google to search for the papers.</span></font></div></blockquote></div><div><br>More questions:<br>* Google or GoogleScholar? [Apparently they can give very different answers]<br><br>Assuming it was GoogleScholar. <br>


* How was the subject classification done?<br><br>I can see one method how the &quot;Gold&quot; access papers were retrieved - by mapping the Journal onto known Gold journals (sic). (I cannot see how hybrid gold were easily measured but the numbers are probably too small to worry about statistically)<br>


<br>I cannot see the next phase but I can conjecture. More questions:<br>* did he use his/Google results to compare with WoS?<br><br>* how did he determine that the paper was Green? Almost by definition this has to be somewhere other than the publisher&#39;s site. [so the paper needs another search for the paper mounted somewhere OTHER than the publisher. <br>


<br>* does he then have a system to determine whether the paper is readable (not all papers in repositories are readable, as we have seen).<br><br>If he has such as system then it would seem to answer the key question:<br>


* if I find a paper on a publisher&#39;s site can I find a free-as-in-beer copy somewhere else on the web?<br><br>If he can really answer that question then is his system openly available?<br><br>P.<br><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">


_______________________________________________<br>
GOAL mailing list<br>
<a href="mailto:GOAL@eprints.org" target="_blank">GOAL@eprints.org</a><br>
<a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal" target="_blank">http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal</a><br>
<br></blockquote></div><div class="HOEnZb"><div class="h5"><br><br clear="all"><br>-- <br>Peter Murray-Rust<br>Reader in Molecular Informatics<br>Unilever Centre, Dep. Of Chemistry<br>University of Cambridge<br>CB2 1EW, UK<br>

<a href="tel:%2B44-1223-763069" value="+441223763069" target="_blank">+44-1223-763069</a><br>
</div></div><br>_______________________________________________<br>
GOAL mailing list<br>
<a href="mailto:GOAL@eprints.org">GOAL@eprints.org</a><br>
<a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal" target="_blank">http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal</a><br>
<br></blockquote></div><br></div></div>