<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body>
hi Peter,
<div><br>
</div>
<div>If many knowledge projects are advancing our knowledge through the means that you have described, surely there are others than the one you started yesterday? Can you provide a list or literature review of such studies?</div>
<div><br>
</div>
<div>My OA APC study uses data from different sources that do not have a common set of terms:&nbsp;</div>
<div>dataverse.scholarsportal.info/dataverse</div>
<div><br>
</div>
<div>If we had to restrict data collection to CC-BY licensed works this research could not be done, and to the extent it could be done, publishers who do not want us to study them could easily opt out by not using CC-BY licenses on the pages where this information
 is found. In other words CC-BY licenses raise issues for data collection analysis.</div>
<div><br>
</div>
<div>I would like to note some methodological concerns with such the approach described by PMC (automatically gathering data from tables).Taking data from different studies without fully accounting for difference in methods (eg definition or measurement) could
 easily lead to false conclusions. Worse, such false conclusions would be highly replicable leading to false confidence in results, ie anyone could repeat the same mistakes and come to the same conclusion of unknown external validity.&nbsp;</div>
<div><br>
</div>
<div>For the 2016/17 OA APC dataset I am adding a &quot;providence&quot; column because the data in the 2016 APC column comes from different researchers with some differences in data collection. Even in a single dataset, to analyze one needs to understand when you are
 comparing apples with apples or macintoshes with Spartans. Automating data analysis without full comprehension of the data strikes me as problematic.</div>
<div><br>
</div>
<div>best,</div>
<div>&nbsp;</div>
<div>Heather Morrison&nbsp;</div>
<div><br>
</div>
<div><br>
</div>
<div><br>
</div>
<div>-------- Original message --------</div>
<div>From: Peter Murray-Rust &lt;pm286@cam.ac.uk&gt; </div>
<div>Date: 2017-01-24 4:27 AM (GMT-05:00) </div>
<div>To: &quot;Global Open Access List (Successor of AmSci)&quot; &lt;goal@eprints.org&gt; </div>
<div>Subject: Re: [GOAL] How much of the content in open repositories is able to meet the definition of open access?
</div>
<div><br>
</div>
<div>
<div dir="ltr">
<div>
<div>
<div>
<div>
<div>
<div>
<div>There are many activities where CC BY or a more liberal licence (CC 0) is the only way that modern science can be done.
<br>
<br>
</div>
Many knowledge-based projects in science , technology, medicine, use thousands of documents a day to extract and publish science. (We started one yesterday at
<a href="https://github.com/ContentMine/cm-ucl/">https://github.com/ContentMine/cm-ucl/</a> to extract data from tables in PDF. This will aim to analyse 1000 papers per day - and that limit is set by the licences - if we were allowed we could index 10,000 papers/day
 in all disciplines.<br>
<br>
</div>
To do reproducible science it is critical that the raw data (in this case scientific articles) are made publicly available so that others can reproduce the work. Any friction such as writing to the author, reading a non-standard licence, etc. makes the project
 impossible. We are often limited to using the Open subset (CC BY) in EuropePMC. We cannot afford to put a single CC NC, CC ND, &quot;unlicensed freely available&quot; manuscript in the repository in case we are sent a take-down notice. That would destroy the whole experiment.<br>
<br>
</div>
<div>These experiments are part of the science of the future. If we had been allowed to use them it is liklely that the Ebola outbreak in Liberia would have been predicted (The Liberian government's assessment, not mine). Whether it would have been prevented
 we don't know, but at least it would not have been impeded by copyright and paywalls.<br>
<br>
</div>
Put simply. Unless the scientific material is CC BY or CC 0 we cannot use it for knowledge-driven STM. I have estimated that the opportunity cost of this can run into billions of dollars.<br>
<br>
</div>
Repositories do not work for science. They are fragmented, non-interoperable and covered with prohibitions on automatic re-use. I have not met scientists who are systematically using institutional repositories of data mining.<br>
<br>
</div>
It seems that the desire of arts, humanities are in direct conflict with the needs of STM. I note that there are few scientists posting on this list. Maybe this division should be recognised and the STM community should continue with its own policies og CC
 BY and the rest use whatever commonality they can achieve.<br>
<br>
</div>
There are no simple solutions where the law is concerned. Only CC BY gives certainty. CC NC and CC ND may be valuable for A&#43;H but they are very difficult to operate in any area of endeavour.<br>
<br>
</div>
I was told 12 years ago on this list that I should be patient and the Green program would deliver universal access and then I could start mining the literature. I have been patient but it hasn't happened. I am told that OpenAIRE still doesn't expose full-text.&nbsp;
 We should recognize it and look for alternative solutions.<br>
<div><br>
<div>
<div>
<div><br>
<br>
</div>
</div>
</div>
</div>
</div>
<div class="gmail_extra"><br>
<div class="gmail_quote">On Mon, Jan 23, 2017 at 7:55 PM, Heather Morrison <span dir="ltr">
&lt;<a href="mailto:Heather.Morrison@uottawa.ca" target="_blank">Heather.Morrison@uottawa.ca</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex; border-left:1px #ccc solid; padding-left:1ex">
<div style="word-wrap:break-word">
<div>With all due respect to the people who created and shared the &quot;how open is it&quot; spectrum tool, I find some of the underlying assumptions to be problematic.</div>
<div><br>
</div>
<div>For example the extreme of closed access assumes that having to pay subscriptions, membership, pay per view etc. is the far end of closed. My perspective is that the opposite of open is closure of knowledge. Climate change denied, climate scientists muzzled,
 fired or harassed, climate change science defunded, climate data taken down and destroyed, deliberate spread of misinformation.&nbsp;</div>
<div><br>
</div>
<div>This is not a moot point. This end of the spectrum is a reality today, one that is far more concerning for many researchers than pay walls (not that I support paywalls).</div>
<div><br>
</div>
<div>Fair use in listed in a row named closed access. I argue that fair use / fair dealing is essential to academic work and journalism, and must apply to all works, not just those that can be subject to academic OA policy.</div>
<div><br>
</div>
<div>There is an underlying assumption about the importance and value of re-use / remix that omits any discussion of the pros, cons, or desirability of re-use / remix that I argue we should be having. Earlier today I mentioned some of the potential pitfalls.
 Now I would like to two potential pitfalls: mistranslation and errors in instructions for dangerous procedures.</div>
<div><br>
</div>
<div>There are dangers of poor published translations to knowledge per se (ie introduce errors) and to the author's reputation, ie an author could easily be indirectly misquoted due to a poor translation. There are good reasons why some authors and journals
 hesitate to grant &nbsp;downstream translations permissions.&nbsp; Reader side translations (eg automated translation tools) are not the same as downstream published translations, although readers should be made aware of the current limitations of automated translation.</div>
<div><br>
</div>
<div>If people are copying instructions for potentially dangerous procedures &nbsp;(surgery, chemicals, engineering techniques), and they are not at least as expert as the original author, it might be in everyone's best interests if downstream readers are not invited
 and encouraged to manipulate the text, images, etc.</div>
<div><br>
</div>
<div>In creative works, eg to prepare a horror flick, by all means take this and that, mix it together and create something new and intriguing. I am not convinced that the same arguments ought to apply to works that might guide procedures in a real hospital
 operating room.</div>
<div><br>
</div>
<div>I suggest the &quot;how open is it&quot; spectrum is a useful exercise that has served a purpose for some but not a canon for all to adhere to.&nbsp;</div>
<div><br>
</div>
<div>best,</div>
<div><br>
</div>
<div>Heather Morrison&nbsp;</div>
<span class="">
<div><br>
</div>
<div><br>
</div>
<div><br>
</div>
<div>-------- Original message --------</div>
<div>From: David Prosser &lt;<a href="mailto:david.prosser@rluk.ac.uk" target="_blank">david.prosser@rluk.ac.uk</a>&gt;
</div>
<div>Date: 2017-01-23 2:16 PM (GMT-05:00) </div>
<div>To: &quot;Global Open Access List (Successor of AmSci)&quot; &lt;<a href="mailto:goal@eprints.org" target="_blank">goal@eprints.org</a>&gt;
</div>
<div>Subject: Re: [GOAL] How much of the content in open repositories is able to meet the definition of open access?
</div>
<div><br>
</div>
</span>
<div>
<div class="h5">
<div>I rather like the ‘How open is it?’ tool that approaches this as a spectrum:
<div><br>
</div>
<div><a href="http://sparcopen.org/our-work/howopenisit/" target="_blank">http://sparcopen.org/our-work/<wbr>howopenisit/</a></div>
<div><br>
</div>
<div><br>
<div><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; line-height:normal; border-spacing:0px"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word"><span class="m_-1801999813122412872Apple-style-span" style="border-collapse:separate; color:rgb(0,0,0); font-family:Helvetica; font-style:normal; font-variant:normal; font-weight:normal; letter-spacing:normal; line-height:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px">
<div style="word-wrap:break-word">I may be quite ‘hard line’, but I acknowledge that by moving along the spectrum a paper, monograph, piece of data (or whatever) becomes more open - and more open is better than less open.</div>
<div style="word-wrap:break-word"><br>
</div>
<div style="word-wrap:break-word">If the funders have gone to the far end of the spectrum it is perhaps because they feel that the greatest benefits are there, not because they have been convinced that they have to follow the strict, ‘hard line’ definition
 of open access.</div>
<div style="word-wrap:break-word"><br>
</div>
<div style="word-wrap:break-word">David</div>
<div style="word-wrap:break-word"><br>
</div>
<div style="word-wrap:break-word"><br>
</div>
</span></div>
</span></div>
</span></div>
</span></div>
</span></div>
</span></div>
</span></div>
</span></div>
</span></span></div>
<br>
<div>
<blockquote type="cite">
<div>On 23 Jan 2017, at 18:30, Richard Poynder &lt;<a href="mailto:richard.poynder@gmail.com" target="_blank">richard.poynder@gmail.com</a>&gt; wrote:</div>
<br class="m_-1801999813122412872Apple-interchange-newline">
<div>
<div dir="ltr">
<div class="gmail_default"><font face="trebuchet ms, sans-serif">Hi Marc,</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif">You say:</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><span>&quot;</span><span>I certainly qualify as an OA advocate, and as such:</span><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif">I don’t equate OA with CC BY (or any CC license); in fact, I’m a little bit tired of discussions about what 'being OA' means.&quot;</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><font>I hear you, but I think the key point here is that OA advocates (perhaps not you, but OA advocates) are successfully convincing a growing number of research funders (e.g. Wellcome Trust,
 RCUK, Ford Foundation,&nbsp;</font><span>Hewlett Foundation,&nbsp;</span><span>Gates Foundation etc.) that CC BY is the only acceptable form of open access.&nbsp;</span></font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif">So however tired you and Stevan might be of discussing it, I believe there are important implications and consequences flowing from that.&nbsp;</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif"><br>
</font></div>
<div class="gmail_default"><font face="trebuchet ms, sans-serif">Richard Poynder</font></div>
<div class="gmail_default" style="font-family:&quot;trebuchet ms&quot;,sans-serif; font-size:large; color:rgb(0,0,255)">
<br>
</div>
<div class="gmail_default" style="font-family:&quot;trebuchet ms&quot;,sans-serif; font-size:large; color:rgb(0,0,255)">
<br>
</div>
</div>
<div class="gmail_extra"><br>
<div class="gmail_quote">On 23 January 2017 at 16:31, Couture Marc <span dir="ltr">
&lt;<a href="mailto:marc.couture@teluq.ca" target="_blank">marc.couture@teluq.ca</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex; border-left:1px #ccc solid; padding-left:1ex">
<div lang="FR-CA">
<div class="m_-1801999813122412872m_-2334320916963151796WordSection1">
<p class="MsoNormal"><span>Hi all,<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">Just to be clear, my position on the basic issue here.<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">I certainly qualify as an OA advocate, and as such :<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">- I don’t equate OA with CC BY (or any CC license); in fact, I’m a little bit tired of discussions about what “being OA” means.<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">- I work to help increase the proportion of gratis OA, still much too low.<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">- I try to convince my colleagues that CC BY is the best way to disseminate scientific/scholarly works and make them useful.<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">I favour CC BY over the restricted versions (mainly -NC) because I find the arguments about potentially unwanted or devious uses far less compelling than those about the advantages of unrestricted uses and the drawbacks
 of restrictions that can be much more stringent than they seem at first glance.<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-CA">Like Stevan said, OA advocates are indeed a plurality. The opposite would bother me.</span><span class="m_-1801999813122412872HOEnZb"><font color="#888888"><span lang="EN-CA"><u></u><u></u></span></font></span></p>
<span class="m_-1801999813122412872HOEnZb"><font color="#888888">
<p class="MsoNormal"><span lang="EN-GB"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB">Marc Couture<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB" style="color:#1f497d"><u></u>&nbsp;<u></u></span></p>
<p class="MsoNormal"><span lang="EN-GB" style="color:#1f497d"><u></u>&nbsp;<u></u></span></p>
</font></span></div>
</div>
<br>
______________________________<wbr>_________________<br>
GOAL mailing list<br>
<a href="mailto:GOAL@eprints.org" target="_blank">GOAL@eprints.org</a><br>
<a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal" rel="noreferrer" target="_blank">http://mailman.ecs.soton.ac.uk<wbr>/mailman/listinfo/goal</a><br>
<br>
</blockquote>
</div>
<br>
<br clear="all">
<div><br>
</div>
-- <br>
<div class="m_-1801999813122412872gmail_signature">Richard Poynder<br>
<a href="http://www.richardpoynder.co.uk/" target="_blank">www.richardpoynder.co.uk</a></div>
</div>
______________________________<wbr>_________________<br>
GOAL mailing list<br>
<a href="mailto:GOAL@eprints.org" target="_blank">GOAL@eprints.org</a><br>
<a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal" target="_blank">http://mailman.ecs.soton.ac.<wbr>uk/mailman/listinfo/goal</a><br>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</div>
</div>
<br>
______________________________<wbr>_________________<br>
GOAL mailing list<br>
<a href="mailto:GOAL@eprints.org">GOAL@eprints.org</a><br>
<a href="http://mailman.ecs.soton.ac.uk/mailman/listinfo/goal" rel="noreferrer" target="_blank">http://mailman.ecs.soton.ac.<wbr>uk/mailman/listinfo/goal</a><br>
<br>
</blockquote>
</div>
<br>
<br clear="all">
<br>
-- <br>
<div class="gmail_signature">
<div dir="ltr">
<div>Peter Murray-Rust<br>
Reader Emeritus in Molecular Informatics<br>
Unilever Centre, Dept. Of Chemistry<br>
University of Cambridge<br>
CB2 1EW, UK<br>
&#43;44-1223-763069</div>
</div>
</div>
</div>
</div>
</body>
</html>