Changeset 1888

Show
Ignore:
Timestamp:
11/29/06 12:41:44
Author:
mizzy
Message:

CustomFeed?::YouTube?: fix regexp to get page content

Files:

Legend:

Unmodified
Added
Removed
Modified
Copied
Moved
  • trunk/plagger/lib/Plagger/Plugin/CustomFeed/YouTube.pm

    r1775 r1888  
    6868            m!<div class="vtitle">! 
    6969                and $title_flag = 1; 
    70             m!<a href="/watch\?v=([^"]+)">(.+)</a>! 
     70            m!<a href="/watch\?v=([^"]+)"[^>]+>(.+)</a>! 
    7171                and do { 
    7272                    if($title_flag){ 
     
    7676                    } 
    7777                }; 
    78             m!<img src="(http://[\w-]*static\d+(.[\w-]+)?\.youtube.com/[^">]+/[12].jpg)" class="vimg120" />! 
     78            # get image url 
     79            m!<img src="(http://[\w-]*static\d+(.[\w-]+)?\.youtube.com/[^">]+/[12].jpg)" border="0" class="vimg120" />! 
    7980                and $data->{image}->{url} = $1; 
     81            # get description 
    8082            m!<div class="vdesc">! 
    81                 and $data->{description} = <$fh>; 
     83                and do { 
     84                    <$fh>; 
     85                    $data->{description} = <$fh>; 
     86                }; 
     87            # get tags 
    8288            m!<div class="vtagLabel">Tags:</div>! 
    8389                and $tag_flag = 1; 
    84             m!(<a href="/results\?search_type=.*)! 
     90            m!(<a href="/results\?search_query=.*)! 
    8591                and do { 
    8692                    if($tag_flag){ 
     
    8995                    } 
    9096                }; 
    91             m!profile\?user=([^"]+)! 
     97            # get author 
     98            m!From:</span> <a href="/user/[^>]+">([^<]+)</a>! 
     99                and $data->{author} = $1; 
     100            m/<!-- end vEntry -->/ 
    92101                and do { 
    93102                    $context->log( info => 'Got ' . $data->{title}); 
    94                     $data->{author} = $1; 
    95103                    my $entry = Plagger::Entry->new; 
    96104                    $entry->title($data->{title}); 
     
    106114 
    107115                    # tags 
    108                     while( $data->{tags} =~ /<a href="\/results\?search_type=[^"]+" class="dg">([^<]+)<\/a>/gms){ 
     116                    while( $data->{tags} =~ /<a href="\/results\?search_query=[^"]+" class="dg">([^<]+)<\/a>/gms){ 
    109117                        $entry->add_tag($1); 
    110118                    } 
     
    128136 
    129137                    if ($video_url) { 
     138                        warn $video_url; 
    130139                        my $video_id = ( $video_url =~ /video_id=(\w+)/ )[0]; 
    131140