These are good questions from Bo-Christer Björk and we are now doing further breakdowns of the robot analyses to estimate the proportions of publisher-provided delayed access vs author self-archiving.<div><br></div><div>Stevan Harnad<br>
<br><div class="gmail_quote">On Wed, Nov 7, 2012 at 12:44 PM, Bo-Christer Björk <span dir="ltr">&lt;<a href="mailto:bo-christer.bjork@hanken.fi" target="_blank">bo-christer.bjork@hanken.fi</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

  
    
  
  <div bgcolor="#FFFFFF" text="#000000">
    <div>Dear Sally,<br>
      <br>
      This has obviously puzzled us as well as Yassine and Stevan.<br>
      <br>
      The discrepancies in the green figures are easier to deal with.
      Since Yassine&#39;s gold figures are so low and everything else which
      the robots have found is classified as &quot;self-archieved&quot; the hits
      classified as green rise over 20 %. However, in our studies we
      have further split down such copies into further categories. It
      turns out that part are not self-archived at all but articles in
      delayed OA journals (the robot searches are made with a
      considerable delay due to the availability of meta-data), paid
      hybrid articles and promotionally free articles in subscription
      journals (many journals seem to make one issue per annum free as
      advertisement). All of these are caught in the same robotized net
      and should be sorted out. In 2011 there were around 83&#39;000 delayed
      OA articles, around 10&#39;000 hybrid article and an unknown number of
      promotional OA articles in ISI journals which together make at
      least 7-8 %.<br>
      <br>
      The huge discrepancy in the pure gold number is more difficult to
      explain, and the fact that Yassine&#39;s study had a more limited
      number of disciplines with equally big samples cannot alone
      explain it. Their numbers show hardly any growth in the gold share
      in ISI between 2005 and 2010, when our as we believe very robust
      method shows a very substantial growth (from 6,6 % to 9 % share in
      ISI between just 2008 and 2011). Also their numbers are even lower
      than the McVeigh study from 2003, a year when BMC and PLoS were
      just started.<br>
      <br>
      Best regards<br>
      <br>
      Bo-Christer<br>
      <br>
      <br>
      <br>
      <br>
      <br>
      <br>
      <br>
      On 11/6/12 6:41 PM, Sally Morris wrote:<br>
    </div>
    <blockquote type="cite">
      
      
      <div><span>Can anyone shed light on the
          following apparent discrepancy:</span></div>
      <div><span></span> </div>
      <div><span>Laakso and Bjork (<a href="http://www.biomedcentral.com/1741-7015/10/124" target="_blank">http://www.biomedcentral.com/1741-7015/10/124</a>) 
          give a figure for articles published in 2011 and indexed in
          Scopus - 11% in full Gold journals, 0.7% in hybrid journals,
          and 5% in &#39;delayed OA&#39; journals with a delay of no more than
          12 months [Stevan may not like the term, but I think the rest
          of us understand it well enough, so let&#39;s not get into that!]</span></div>
      <div><span></span> </div>
      <div><span>Gargouri et al (<a href="http://arxiv.org/ftp/arxiv/papers/1206/1206.3664.pdf" target="_blank">http://arxiv.org/ftp/arxiv/papers/1206/1206.3664.pdf</a>),
          on the other hand, give a figure of just 1.2% articles
          published in 2010 via Gold OA</span></div>
      <div><span></span> </div>
      <div><span>Furthermore, Gargouri et al
          give the percentage of 2010 articles available via Green OA as
          21.9% (2008 articles 20.6%).  Bjork et al (<a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0011273" target="_blank">http://www.plosone.org/article/info:doi/10.1371/journal.pone.0011273</a>)
          had a very different figure of 11.9% for articles published in
          2008.</span></div>
      <div><span></span> </div>
      <div><span>I can&#39;t get my head round
          the spectacular difference between the two sets of figures -
          can someone please explain?  I can&#39;t believe that
          inclusion/exclusion in Scopus can possibly account for it. Am
          I missing something?</span></div>
      <div><span></span> </div>
      <div><span>Thanks</span></div>
      <div><span></span> </div>
      <div><span>Sally</span></div>
      <div><span></span> </div>
      <div> </div>
      <div>Sally Morris</div>
      <div>South House, The Street, Clapham, Worthing, West Sussex, UK 
        BN13 3UU</div>
      <div>Tel:  <a href="tel:%2B44%20%280%291903%20871286" value="+441903871286" target="_blank">+44 (0)1903 871286</a></div>
      <div>Email:  <a href="mailto:sally@morris-assocs.demon.co.uk" target="_blank">sally@morris-assocs.demon.co.uk</a></div>
      <div> </div>
    </blockquote>
    <br>
  </div>

<br>_______________________________________________<br>
GOAL mailing list<br>
<a href="mailto:GOAL@eprints.org">GOAL@eprints.org</a><br>
<a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal" target="_blank">http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal</a><br>
<br></blockquote></div><br></div>