Changeset 1778

Show
Ignore:
Timestamp:
10/18/06 18:29:20
Author:
miyagawa
Message:

Summary::Simple: support very dumb summary extractor, to find the first sentence

Files:

Legend:

Unmodified
Added
Removed
Modified
Copied
Moved
  • trunk/plagger/lib/Plagger/Plugin/Summary/Simple.pm

    r1741 r1778  
    3333        } 
    3434    } else { 
    35         # text: substring with 255 bytes 
     35        # text: strip until the ending dots 
     36        # TODO: make this 255 configurable? 
     37        if ($text =~ /^(.+?(\x{3002}|\.\s))/ && length($1) <= 255) { 
     38            (my $summary = $1) =~ s/\s*$//; 
     39            return $summary; 
     40        } 
     41 
    3642        if (length($text) > 255) { 
    3743            return substr($text, 0, 255) . "..."; 
  • trunk/plagger/t/plugins/Summary-Simple/base.t

    r1741 r1778  
    11use strict; 
     2use utf8; 
    23use t::TestPlagger; 
    34 
     
    8081--- expected 
    8182<p>First paragraph</p> 
     83 
     84=== I18N. Japanese plaintext 
     85--- input 
     86Shibuya Perl Mongers は東京地区とくに渋谷周辺のインターネット関連企業に勤務している Perl ユーザのコミュニティ形成を目指す非営利の団体です。主な活動内容はプログラミング言語 Perl に関係するメンバー主催の勉強会やインターネット上での啓蒙活動や情報交換です。Shibuya Perl Mongers は Perl を利用し、スキル向上を望む方であればどなたでも無料で参加できます。 
     87--- expected 
     88Shibuya Perl Mongers は東京地区とくに渋谷周辺のインターネット関連企業に勤務している Perl ユーザのコミュニティ形成を目指す非営利の団体です。 
     89 
     90=== English plaintext 
     91--- input 
     92There'll be the Web 2.0 Conference in San Francisco. blah blah blah. 
     93--- expected 
     94There'll be the Web 2.0 Conference in San Francisco.