Thank you very much for this Alejandro.<br><br>Just to confirm I understand you correctly, you are saying that it does not matter that the eye movement artifacts in the EOG monopolar channels are larger than those present in scalp electrodes, because the assumption is that the overall average of the noise will still be gaussian and therefore sum to zero, regardless of whether it includes the higher magnitude activity in EOG channels?<br>

<br><br><br><br><div class="gmail_quote">On Wed, Feb 15, 2012 at 4:50 AM, Alejandro <span dir="ltr"><<a href="mailto:alejo.ojeda83@gmail.com" target="_blank">alejo.ojeda83@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div><br></div><div>Here I will  address the question: should I include EOG monopolar channels in the average reference? After some years now trying this and that for pre-processing my EEG data, doing some reading, and asking to people more knowledgeable than me, I'll explain why I would answer YES to that question. </div>


<div><br></div>The problem of referencing the data comes from the fact that physiological signals measured on the scalp are always contaminated by noise, which is several orders of magnitude bigger. For instance, let's suppose we recorded the voltage from three different places:<div>


<br><div><font face="'Times New Roman'"><span style="border-collapse:collapse;font-size:medium"><i></i></span></font><var>x</var><sub>1</sub> = <var>x</var><sup>~</sup><sub>1</sub>
          + <var>n</var><sub>1</sub> </div><div><var>x</var><sub>2</sub> = <var>x</var><sup>~</sup><sub>2</sub>
          + <var>n</var><sub>2</sub> </div><div><var>x</var><sub>3</sub> = <var>x</var><sup>~</sup><sub>3</sub>
          + <var>n</var><sub>3</sub></div><div><sub><br></sub></div><div><sub><br></sub></div>Where the signal we measure <i>X</i> is assumed to be a mixture of two components: 1) the electrical activity generated by physiological processes inside the brain, transmitted across several layers of tissue that finally reach the scalp , <span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><var>x</var></span><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><sup>~</sup></span>, and 2) the noise at that point, <i>n</i>. Because the noise itself is a signal formed by a contribution of many non-physiological processes from a different nature (instrumental, electromagnetic, thermal, etc.) is usually represented as a random variable assumed gaussian with zero mean.<div>


<br></div><div>The purpose of the average reference is to minimize the contribution of the noise keeping the tiny variations inside it that represent the physiological activity. Let's do the math for one electrode:</div>


<div><br></div><div><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><var>x</var><sub>1<var>r</var></sub> </span><span style="font-family:'Times New Roman';font-size:medium"><span style="font-family:arial;font-size:small">= </span><span style="font-family:arial;font-size:small"><var>x</var></span><span style="font-family:arial;font-size:small"><sup>~</sup></span><span style="font-family:arial;font-size:small"><sub>1</sub></span><span style="font-family:arial;font-size:small">
          + </span><span style="font-family:arial;font-size:small"><var>n</var></span><span style="font-family:arial;font-size:small"><sub>1<span style="font-size:small"> </span></sub></span></span><span style="font-size:11px">- ( </span><var>x</var><sup>~</sup><sub>1</sub> +
              <var>n</var><sub>1</sub> + <var>x</var><sup>~</sup><sub>2</sub>
              + <var>n</var><sub>2</sub> + <var>x</var><sup>~</sup><sub>3</sub>
              + <var>n</var><sub>3 </sub><span style="font-size:11px">) / 3</span></div><div><span style="font-size:11px"><br></span></div>where <span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><var>x</var><sub>1<var>r</var></sub></span> represents the signal in the electrode 1 after removing the average reference. Re-grouping terms we have:</div>


<div> <br><div><div><div><div><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><var>x</var></span><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><sub>1<var>r</var></sub></span><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"> </span><span style="font-family:'Times New Roman';font-size:medium"><span style="font-family:arial;font-size:small">= </span><span style="font-family:arial;font-size:small"><var>x</var></span><span style="font-family:arial;font-size:small"><sup>~</sup></span><span style="font-family:arial;font-size:small"><sub>1</sub></span><span style="font-family:arial;font-size:small"> </span><span style="font-family:arial;font-size:small"><sub><span style="font-size:small"> </span></sub></span></span><span style="font-size:11px">- ( </span><var>x</var><sup>~</sup><sub>1</sub>  + <var>x</var><sup>~</sup><sub>2</sub>  + <var>x</var><sup>~</sup><sub>3</sub> <sub> </sub><span style="font-size:11px">) / 3  - </span><span style="font-size:11px"> ( </span><i>n</i><sub>1</sub> - <var>n</var><sub>1</sub> + <var>n</var><sub>2</sub> + <var>n</var><sub>3 </sub><span style="font-size:11px">) / 3</span></div>


<div><font size="3"><span style="font-size:11px"><br></span></font></div><div>But because the sum of several gaussian processes ( as the noise is considered ) is also a gaussian process, then the contribution of the noise goes to zero, ending up with a signal <span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><var>x</var></span><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><sub>1<var>r </var></sub></span>that is still a mixture of things but at least those things represent more closely the physiological precesses:</div>


<div><br></div><div><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><var>x</var></span><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"><sub>1<var>r</var></sub></span><span style="font-family:'Times New Roman';font-size:medium;border-collapse:collapse"> </span><span style="font-family:'Times New Roman';font-size:medium"><span style="font-family:arial;font-size:small">= </span><span style="font-family:arial;font-size:small"><var>x</var></span><span style="font-family:arial;font-size:small"><sup>~</sup></span><span style="font-family:arial;font-size:small"><sub>1</sub></span><span style="font-family:arial;font-size:small"> </span><span style="font-family:arial;font-size:small"><sub><span style="font-size:small"> </span></sub></span></span><span style="font-size:11px">- ( </span><var>x</var><sup>~</sup><sub>1</sub>  + <var>x</var><sup>~</sup><sub>2</sub> + <var>x</var><sup>~</sup><sub>3</sub> <sub> </sub><span style="font-size:11px">) / 3</span></div>


<div><br></div><div>Generalizing to n electrodes we could say that:</div><div><var><b>X</b></var>
      <sub><var>r</var></sub>
      = ( <var><b>I</b></var>
      <sub><var>n</var></sub> -<b>1</b>⋅<b>1</b>
      <sup><var>T</var></sup> /n)
      <var><b>X</b></var></div><div><var><b><br></b></var></div><div>the average reference data <var><b>X</b></var> <sub><var>r </var></sub>is equal to the so called "average reference operator" <b><i>H</i></b>=( <var><b>I</b></var> <sub><var>n</var></sub> -1⋅1 <sup><var>T</var></sup> ) times the raw data <i><b>X</b></i>. To construct this operator in Matlab just type: </div>


<div><br></div><div>>> H = eye(n) - ones(n)/n;</div><div> </div><div>where <i>n</i> represents the number of channels we include in the average.  </div><div><br></div><div>One interesting thing about <b><i>H</i></b> is that it is what the mathematicians call an idempotent matrix, this is a matrix where <i>H*H*...H=H. </i>This has the practical implication that removing the average reference of your data several times, without doing anything else in between, doesn't introduce additional modifications.  </div>


<div><br></div><div>However it's true that multiplying by <i><b>H</b></i> could be seen as a mixing process of "hopefully" physiological signals, and there is when ICA comes to play an important roll. ICA will find (as far as it can and its assumptions are close to the reality) those sources <var>x</var><sup>~</sup><sub>1</sub> , <var>x</var><sup>~</sup><sub>2</sub> , <var>x</var><sup>~</sup><sub>3 ... </sub>associated to the local space and temporal coherent electrical activity generated inside the tissue (I say "tissue" to be general because usually we have components representing brain signals, muscle,  EKG, etc). Just for the record, I'm not saying that <i><b>H</b></i> is the mixing matrix per se, I'm just saying that it contributes to the mixing process that takes place in the scalp and the other layers of tissue.</div>


<div><br></div><div>I hope these thoughts can give you some clues about your pre-processing. They represent part of my practical experience and reading, but this still remains as an open field so don't take my words as pure dogma. </div>


<div><br></div><div>Regards,</div><div>Alejandro</div><br></div></div></div></div></blockquote></div>-- <br>_________________________________________________________________<br>Matthew Stief<br>Human Development | Sex & Gender Lab | Cornell University<br>

<a href="http://www.human.cornell.edu/HD/sexgender" target="_blank">http://www.human.cornell.edu/HD/sexgender</a><br><br><br>Heterosexuality isn't normal, it's just common.<br>-Dorothy Parker<br>