【第4回】eBay無在庫セラーをサボらせまくるツールをRPA(Uipath)でサクサク作ってみよう

せどり

はじめに

こんにちは。ryupi(@RyukiLol)です。

第3回ではスクレイピングの肝であるデータ収集を実行しました。

第3回まだ読んでいない方はこちらからお読みください。

【第3回】eBay無在庫セラーをサボらせまくるツールをRPAでサクサク作ってみよう

第4回ではスクレイピングの肝であるデータ収集の仕上げをしていきます。

それではさっそくやっていっていきましょう

前回に引き続き、実際のメルカリの商品ページを対象にスクレイピングしていきます。

復習:サクッと振り返る

商品ページ(https://jp.mercari.com/item/m81917689794)

を対象にブラウザ内で要素を指定し、データが取得できた!

しかし、その後、違う商品ページ(https://jp.mercari.com/item/m60413187660)

を対象にデータを取得しようとしたら

以下のようなエラーが発生しました。

 

そして、汎用性を高く、つまりはどの商品でもデータ収集できるようにするには追加作業が必要

と話をしました。

【余談】エラーメッセージは答えやヒントがいっぱい

ところで、今回エラーが発生しましたが

エラー発生の時はエラーメッセージを読んでいますか?

エラーメッセージって長いし、なんか難しそうだから読みたくない。

その気持ちはすごくわかるのですが、エラーメッセージには答えやヒントがたくさん書いてあります。

エラーメッセージを読まないのは問題の解決を放棄しているも同然です。

実は今回の問題もエラーメッセージを読んでいれば原因はすぐにわかります。

エラーメッセージを解読

エラーメッセージは以下の通りです。

‘SPAN’: このセレクターに対応する UI 要素が見つかりませんでした:
[1] <webctrl tag=’MER-PRICE’/>
[2] <webctrl aaname=’7,400′ shadowhostid=” tag=’SPAN’/>
セレクター タグの検索に失敗しました:
[2] <webctrl aaname=’7,400′ shadowhostid=” tag=’SPAN’/>
見つかった最も近い一致は次のとおりです:
[87%] <webctrl aaname=’5,500′ shadowhostid=” tag=’SPAN’/>
[67%] <webctrl aaname=’¥’ shadowhostid=” tag=’SPAN’/>

色々わからない単語だらけかと思いますが、

要は

<webctrl aaname=’7,400′ shadowhostid=” tag=’SPAN’/> は NG
<webctrl aaname=’5,500′ shadowhostid=” tag=’SPAN’/> は OK

ということです。

web ページをはじめとしたアプリケーションのインターフェースは階層構造となっています。情報を取得するには情報がどこにあるのか場所を指定してあげる必要があります。その場所を示すのがセレクタです。
このままだと同じ値段の商品にしかデータ収集できません。セレクターを修正する必要があります。

セレクターを修正しよう

UI Explorerの画面が開きました。

右下には、現在のセレクター情報。右にはセレクター選択画面があり、セレクターの編集をクリック1つでできます。

セレクター選択項目内のハイライトした場所をクリックして、チェックを外します

すると、現在のセレクター情報が変更されます

 

また、titleも汎用性高めるために、*に置換します。

 

これでファイルを実行すると以下のように商品情報をとることができました。

とりあえずできたけど、セレクタって何なの?もうちょっと深く知りたいな

そんな方はこちらの動画が参考になると思います。

 

ちょっと難しいなと思うかもですが、セレクタの指定はツール作成の中で1番重要かつ難しいポイントです。ここができるようになると、汎用性が高く使い勝手のいいツールを作ることがで切るので、頑張ってください。私も最初は苦戦しました

演習問題1

十分な汎用性があることを確認するために、任意の5つのメルカリ内の商品を選択し、スクレイピングを実行してみよう

できましたか?こうなればOKですよ

まとめ

スクレイピングの肝であるデータ収集の仕上げを実施しました。

ちょっと難しいかもですが、今回説明したことはツール作りの肝です。

次回はエクセルの読み込みをやっていきます。

 

正直、今回ほどそこまで難しくないので、安心して次に進んでください。

続きはnoteにて公開中です。

 

読者登録すると、当サイトの更新情報をメールで受け取ることができます。
無料なので、ぜひ気楽に登録してみてください。
読者登録ページ

コメント

タイトルとURLをコピーしました