概要

  • Unicode 順でのソート。
  • ひらがな/カタカナを区別せずにソートするには「Unicode::Collate」でソートする。

ソース

  • filesortUnicode.zip
    すべてを展開すべてを収束
      1
      2
      3
      4
      5
      6
      7
      8
      9
     10
     11
     12
     13
     14
     15
     16
     17
     18
     19
     20
     21
     22
     23
     24
     25
     26
     27
    
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
    
    #!/usr/bin/perl
    # Unicode 順のソート
     
    use strict;
    use warnings;
    use utf8;
    use Encode;
    use POSIX qw(locale_h);
    use locale;
    use Unicode::Collate;
     
    my $charsetConsole = 'UTF-8';
     
    binmode( STDIN,  ":encoding($charsetConsole)" );
    binmode( STDOUT, ":encoding($charsetConsole)" );
    binmode( STDERR, ":encoding($charsetConsole)" );
     
    my @list = split( //, 'あぁAAアアaはばぱがかぴひび' );
     
    my $locale = "ja_JP.UTF-8";
    setlocale( LC_ALL, $locale );
    print "locale($locale)\n";
    print join( "", sort(@list) ) . "\n";
    print "\n";
    my $Collator = Unicode::Collate->new();
    print "Unicode::Collate\n";
    print join( "", $Collator->sort(@list) ) . "\n";

出力

  • Cent OS 6, perl v5.10.1
    locale(ja_JP.UTF-8)
    AaアAぁあかがはばぱひびぴア
    
    Unicode::Collate
    aAAぁあアアかがはばぱひびぴ

添付ファイル: filesortUnicode.zip 72件 [詳細]

リロード   新規 下位ページ作成 編集 凍結 差分 添付 コピー 名前変更   ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
Last-modified: Fri, 14 Oct 2016 01:42:01 JST (465d)