<div dir="ltr"><div>I&#39;ve gotten 3-5, but I&#39;m struggling a little on 1 and 2. I&#39;ve tried many different variations, but can&#39;t seem to get the right answer. Here are my two that I feel are &quot;most&quot; correct.</div><div><br></div><div>1:<br># gzcat data.gz | grep &quot;^en[\. ]&quot; | wc -l<br> 2233318<br></div><div>I didn&#39;t feel like sorting or `uniq`ing were necessary since each row should be unique as it is.</div><div><br></div><div>2: <br></div><div># gzcat data.gz | grep &quot;^en[\. ]&quot; | awk &#39;{ print $2 &quot; &quot; $(NF - 1) }&#39; | sort -nrk 2 | head -n 1<br>en 3127515</div><div>For this one, I had to do a little data transformation with awk since using sort with -k 3 and no awk was giving clearly incorrect results.</div><div><br></div><div>The initial gzcat and grep are correct, since it&#39;s the foundation I used for 3-5. Any feedback on my statements above would be appreciated.</div><div><br></div><div>Thanks.<br></div></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div>Jason Ajmo</div><div>Stevens Institute of Technology</div><div>B.S. Cybersecurity &#39;17</div><div>M.S. Computer Science &#39;18</div><div>0x56FA3123</div></div></div>