SatooRu's Profile

全ての記事梶研の進捗日常の記録制作物一覧

[最優秀賞]かみあぷり

2023年6月17日

thumbnail

概要

私たちは今回、福岡で開催された 技育CAMPキャラバン ハッカソン に参加してきました!
ハッカソンとは短期間で集中して開発を行うイベントで、今回はオフラインで開催され、はるばる博多まで行きました(とても大変だった...)

制作したアプリは当日非常によい反応を頂いて最優秀賞をいただくことができました!!
まさか初めてのハッカソンで、B1だけで、最優秀賞を取れるなんて...とてもいい経験になりました。

そんなハッカソンでの制作物について説明したいと思います

紙を破る風神

raijin-break.png

技術スタック

  • Tauri
  • HTML / CSS / JavaScript
  • Tnsorflow.js

制作物について

今回制作したものは かみあぷり というものです。

_geek-camp2023-caravan-val2._006.png

このアプリでは 紙を破く という動作を認知し、スライドを移動するプレゼンを開始/終了する、そしてソースコードを全て消す といった操作ができます。

_geek-camp2023-caravan-val2._008.png

以下の画像は実際のアプリの画面です。
紙を破いたと判断されると 付箋 に書かれている内容が実行され、ログが追加されます。また右側の2本の棒で認識状況がわかるようになっています。

_geek-camp2023-caravan-val2._010.png

実行内容は 付箋 をクリックすることで変更できます。

技術スタックについて

フロントエンドは HTML/CSSVanilla JSを、音の認識には TensorFlow.js を使用しています。
Vanilla JS は高速で軽量な素晴らしいクロスプラットフォームのフレームワークです
本当は React.js を使用する予定でしたが、TensorFlow.js との兼ね合いがうまくいかず、諦めました。
他にもアニメーションをつけるために jQuery を使っているらしいです。(私は知らない)

GUIフレームワークとして Tauri を使用しています。
とりあえず新しいものを使っとけの精神で選びました。

他にも AppleScript や Python を活用しています。

紙を丸める雷神

fujin-crumple.png

努力ポイント

続いて製作中に苦労したポイントなどです

Tnsorflow.js ライブラリの読み込み

TensorFlow.js は npm からインストールすることができます。
インポートして開発環境でテスト...無事できた!!

しかしビルドするとERROR...
とても頑張りました、しかし私には分かりません。

どうしようか...

そこで思いついた解決方法はデモ用の speech-commands.min.js をダウンロードする!
tf.min.js もダウンロードする!ついでに jquery-3.7.0.min.js も!!ハッカソンなら許してくれるはずよくない!!

Googleフォントにいいのがなかったのでダウンロードしたのを読み込んでいます
もっと探せ!!

しかし、Tauri APIを使うために webpack でビルドしていたりします。
他にいい方法がありそうですが1週間という制限があるので早々に見切りを付けました

Tauri でマイクが使えない

Tauri で MacOS のマイクを使用する場合、権限を取得できないというバグがあります

開発環境では動作するのにビルドすると動かない...
Electron に置き換えようかとも.

issue を見てみると同様な問題があり、解決方法もありました.

/src-tauri 内に info.plist を追加し以下の内容を記述することで解決できました

1<?xml version="1.0" encoding="UTF-8"?> 2<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd"> 3<plist version="1.0"> 4<dict> 5 <key>NSCameraUsageDescription</key> 6 <string>Request camera access for WebRTC</string> 7 <key>NSMicrophoneUsageDescription</key> 8 <string>Request microphone access for WebRTC</string> 9</dict> 10</plist>

issues を見てみるというのも大事ですね

モデルの制作

はじめは 素早く破る 長く破る 丸める めくる の4種類を実装する予定でした。
しかし制作していく中で、破る前にめくる音が混ざってしまい精度が不安定となることがありました。
その他にもなんやかんやあり、前日に 破る だけに絞り精度を高めることを優先としました。
音を撮った場所の影響で愛工大の鳥たちでもよく反応します

音の判定

モデルを作成した後は TensorFlow.js にぶち込めば判定結果が戻ってきます。
判定結果はそれぞれの音である確率が 0 ~ 1で返ってきます。
閾値を0.8 以上とすれば完成!!...とも行きませんでした。

こちらは1回破いたときの値です。
0.8 以上となったところの背景を赤くしています
(手抜きのため少しずれているのは気にしないでください)

raw_red-14700.png

このグラフを見ると 1回の破き3回認識してしまっています。
ほかにもノイズが入り、一瞬だけ0.8を超えたり...

そこで移動平均フィルターを掛け、平滑化してあげることで以下のように1回だけ反応するようになりました。

filter_red-14703.png

このグラフは Python を使って描きました
(matplotlibさいこう!!)

さらに前5サンプル(2.5秒)以内に認識した場合は無視するなどの処理も施されています

このお陰で本番でも無事に動いてくれました!!
(最後動かなかったなんてことは...)

PCの操作

紙を破ったと認識した後はPCを操作する必要があります。
別のアプリを操作するなんてセキュリティ的にできるのか、と不安でしたが AppleScript を使用することで実行できました。
セキュリティ的には終わってます

MacOS を使っている方は以下のコマンドをターミナルで実行してみてください

1osascript -e 'display dialog "hi!"'

以下のようなダイアログが出現します

スクリーンショット 2023-06-22 17.34.23.png

キーノートのスライドを開始した状態で以下のコマンドを実行すると、次のスライドに移動することができます

1osascript -e 'tell application "Keynote" to show next'

Tauri からこのコマンドを実行すれば良いわけです。

Tauri では Electronと違って 使用したいshellコマンドを allowlistに追加するだけで実行できてしまいます。非常に簡単です

以下の json は osascript の実行と rm -rf / を許可したときの例です

1 "allowlist": { 2 "shell": { 3 "execute": true, 4 "scope": [ 5 { 6 "name": "run-osascript", 7 "cmd": "osascript", 8 "args": true 9 }, 10 { 11 "name": "remove-os", 12 "cmd": "rm", 13 "args": ["-rf", "/"] 14 } 15 ] 16 } 17 },

実行したいときは JavaScript から以下のように呼び出すだけです

1new Command("run-osascript", ["next.applescript"]).execute();

しかし、それだけではありませんでした。

ソースコードを全消しする場合は以下のスクリプトを実行したいのですが、1行にする方法がわかりません...

1tell application "System Events" 2 keystroke "a" using command down 3 key code 51 4end tell

そこでスクリプトをファイルとして保存しておき、

1osascript delete.applescript

といった形で実行するように変更しました。

/src/osascript/ にスクリプトを保存し、以下のように実行すれば解決!

1new Command("run-osascript", ["./osascript/next.applescript"]).execute();

ではありませんでした。まだそう上手くは行きません。開発環境では動きますがパッケージ化するとパスが変わってしまいます。これに気づいた発表前日、絶望の縁へと落とされました

しかし Tauri は素晴らしいフレームワークです。追加ファイルの埋め込み というものを用意してくれています。
※素晴らしくなくても大体あると思います

src-tauri/osascript/ に移動させ、tauri.config.json に追記します

1 "bundle": { 2 "active": true, 3 "icon": [ 4 "icons/32x32.png", 5 ... 6 ], 7 "resources": ["osascript/*"], 8 },

そして TauriAPI を使ってpathを指定すれば無事に実行することができました!!

1const path = await resolveResource(`osascript/next.applescript`);

おわりに

おわりに、
インパクト重視でネタバレを回避すべく、スライドも原稿も一切見せませんでした。メンターの皆さん、すみませんでした。。

とても環境に配慮した制作

IMG_4681.jpg

ここまで見てくださりありがとうございます。
最後にGitHubのリンクとスライドを載せておきます

GitHub

SystemEngineeringTeam / geekcamp-caravan-2023-vol2

スライド