add comment
authorStefano Zacchiroli <zack@upsilon.cc>
Thu, 5 Feb 2009 16:57:48 +0000 (17:57 +0100)
committerStefano Zacchiroli <zack@upsilon.cc>
Thu, 5 Feb 2009 16:57:48 +0000 (17:57 +0100)
blog/posts/2009/02/sort_gotcha/discussion.mdwn

index e46b265..eb78420 100644 (file)
@@ -1,5 +1,3 @@
-----
-
 I have also wasted days with sort -k. I recommend you to read the real GNU
 documentation ; the Debian info page is unfortunately a fake.
 
@@ -19,3 +17,34 @@ usefulness of
 -- Charles Plessy
 
 ----
+
+Hi!
+
+Note that
+$ sort -u -k1,1 file >x
+is not the same as
+$ sort -k1,1 file | uniq >x
+
+The former syntax is pretty dangerous: it collapses all
+entries with the same sort key(!) == first column into
+one (I think it just throws away all but the first, or
+the last, don't remember, it made no difference when I
+last used it for my case - searching for files with the
+same hash that are not (yet) hardlinked to each other).
+
+Of course, GNU sort may not behave so, but MirBSD sort does.
+
+-- mirabilos
+
+----
+
+> The former syntax is pretty dangerous: it collapses all entries with
+> the same sort key(!) == first column into one.
+
+Yes, I'm aware of that. In fact in my case it doesn't make any
+difference, since my sort key is also a unique key. But you're right:
+it should be pointed out.
+
+-- [[zack]]
+
+----