Napkin menukar teks menjadi visual dengan sedikit AI generatif

Kita semua mempunyai idea, tetapi berkomunikasi dengan berkesan dan memenangi orang lain bukan perkara yang mudah. Jadi bagaimana kita boleh mencapai ini dengan terbaik dalam era kelebihan maklumat dan penumpuan perhatian yang semakin mengecil?

Jika anda adalah jurutera Pramod Sharma dan Jerome Scholler, anda menggunakan Napkin, platform "visual AI" baru yang dibina oleh kedua-duanya. Napkin dilancarkan hari ini dengan pembiayaan sebanyak $10 juta daripada Accel dan CRV.

Napkin lahir daripada kekecewaan Sharma dan Scholler dengan jumlah dokumen dan dek presentasi yang tidak terhingga yang telah menjadi norma dalam dunia korporat. Sebelum memulakan Napkin, Sharma, mantan pekerja Google, telah menubuhkan syarikat permainan pendidikan Osmo. Scholler adalah ahli pasukan asal Osmo dan sebelum itu, pernah berkhidmat di Ubisoft, LucasArts dan Google.

Sharma memberitahu TechCrunch, "Produk inti Napkin diarahkan kepada pemasar, pencipta kandungan, jurutera dan profesional dalam perniagaan menjual idea dan mencipta kandungan." Tujuannya adalah untuk meminimumkan masa dan sakit kepala dalam proses reka bentuk dengan mengubahkannya menjadi aliran yang kebanyakkannya generatif."

"Generatif" merujuk kepada AI generatif. Ya, Napkin adalah lagi satu syarikat yang bertaruh pada potensi teknologi ini dan menyertai senarai panjang syarikat lain. Tetapi terdapat beberapa perkara yang menonjol mengenai pengalaman ini, yang hanya berpangkalan web untuk masa ini.

Dengan Napkin, pengguna bermula dengan teks — satu presentasi, contoh atau dokumen lain yang seumpama — atau mempunyai aplikasi menghasilkan teks dari satu isyarat (contohnya "Garis panduan terbaik untuk temuduga pekerjaan"). Napkin kemudian mencipta kanvas yang seperti Notion dengan teks tersebut, kemudian meletakkan ikon "spark" pada perenggan teks yang, apabila diklik, menukarkan teks menjadi visual yang boleh disesuaikan.

Visual ini tidak terhad kepada imej, merangkumi pelbagai gaya carta aliran, graf, infografik, gambarajah Venn dan pohon keputusan. Setiap imej ini mengandungi ikon yang boleh ditukarkan dengan yang lain dalam galeri Napkin, dan anda mendapat penyambung yang dapat menghubungkan visual dua atau lebih konsep, juga. Warna dan fon adalah boleh disunting, dan Napkin menawarkan "penghias" seperti sorot dan garis bawah untuk menyemarakkan penampilan elemen mana-mana.

Setelah selesai, visual boleh dieksport sebagai fail PNG, PDF atau SVG, atau sebagai URL yang menghubungkan ke kanvas di mana mereka dicipta.

"Berbeza dengan alat sedia ada yang menambah komponen generatif kepada penyunting sedia ada, kami memberi tumpuan kepada pengalaman generatif terlebih dahulu di mana penyuntingan ditambah untuk melengkapkan generasi dan bukan sebaliknya," kata Sharma.

Saya telah mencuba Napkin sejenak untuk mendapatkan rasa apa yang dapat dilakukannya.

Pada langkah penciptaan dokumen, atas rasa ingin tahu yang kelam, saya cuba membuat Napkin menghasilkan sesuatu yang kontroversi, seperti "Amaran untuk bunuh seseorang" atau "Senarai kata-kata kesalahan yang sangat menyakitkan hati." Apa jua AI yang digunakan Napkin tidak memberitahu saya cara untuk membunuh, tetapi ia bersetuju dengan permintaan yang kedua — walau dengan lampiran tentang bagaimana kata-kata kesalahan adalah "dimaksudkan untuk tujuan pendidikan." (Terdapat butang di skrin kanvas untuk melaporkan jenis perilaku AI ini.)

Masalah dijaga, saya melemparkan artikel TechCrunch ke dalam Napkin — draf artikel ini untuk lebih tepat lagi. Dan, maka adalah jelas di mana kekuatan dan kelemahan Napkin terletak.

Napkin melakukannya dengan baik dengan huraian yang mudah, gagasan garis besar, dan naratif dengan garis masa yang jelas. Cara termudah untuk mengatakannya, jika suatu idea membaca seolah-olah lebih baik diilustrasikan secara visual, Napkin lebih kerap daripada tidak akan bangkit untuk keperluan tersebut.

Apabila teks agak kabur, Napkin mencari pembenaran, kadang-kadang menghasilkan visual yang tidak berasaskan pada teks tersebut sama sekali. Lihat yang di bawah, sebagai contoh — ia hampir bersifat tidak logik.

Untuk visual di bawah, Napkin mencipta kelebihan dan kekurangan secara keseluruhan (seperti model generatif cenderung berbuat demikian). Tiada tempat di dalam perenggan saya membincangkan isu privasi atau tahap pembelajaran Napkin.

Napkin kadang-kadang mencadangkan imej atau seni visual untuk visual. Saya bertanya kepada Sharma jika pengguna mungkin perlu bimbang tentang implikasi hak cipta imej-imej ini, dan beliau berkata Napkin tidak menggunakan data awam atau dilindungi IP untuk menghasilkan gambar. "Ia adalah dalaman Napkin jadi pengguna tidak perlu bimbang tentang hak atas kandungan yang dihasilkan," tambahnya.

Saya tidak dapat tidak mengingati bahawa visual Napkin semuanya mematuhi bahasa reka bentuk yang generik dan homogen. Beberapa pengguna awal ciri AI generatif Microsoft untuk PowerPoint telah menggambarkan hasil dari perisian tersebut sebagai "tahap sekolah menengah," dan demo Napkin tidak dapat tidak membawa komen itu ke fikiran saya.

Ini bukanlah untuk menyiratkan bahawa sesetengah perkara ini tidak boleh diperbaiki. Ini masih awal bagi Napkin, akhirnya — platform mempunyai rancangan untuk melancarkan pelan berbayar, tetapi tidak dalam masa terdekat — dan pasukan agak terhad sumbernya oleh saiznya. Terdapat 10 orang di Napkin yang berpangkalan di Los Altos pada masa ini, dan rancangannya adalah untuk berkembang kepada 15 menjelang hujung tahun.

Lagi pun, sedikit yang boleh membantah bahawa Sharma dan Scholler bukanlah usahawan yang berjaya, selepas menjual Osmo kepada raksasa edtech India Byju's dengan harga $120 juta pada tahun 2019. Rich Wong dari Accel menyokong Napkin sebahagiannya kerana terkesan dengan kejayaan Osmo — Wong juga merupakan pelabur awal di Osmo

"Jerome dan Pramod mempunyai keupayaan yang luar biasa untuk mengambil sesuatu yang sangat mencabar dari segi teknikal dan menjadikannya mudah untuk pengguna," kata Wong dalam satu kenyataan. "Sebagai rakan kepada syarikat pertama mereka, Osmo, kami melihat mereka membawa visi untuk gerakan bermain baru kehidupan dengan AI yang boleh berinteraksi. Kami sangat gembira untuk menyokong babak baru ini ketika Napkin membawa visual AI ke dalam penceritaan perniagaan."

Sharma berkata hasil daripada pusingan $10 juta akan digunakan untuk pembangunan produk dan memperoleh jurutera AI dan pereka grafik.

"Semua tenaga dan sumber kami akan dilaburkan pada bagaimana Napkin dapat menghasilkan visual yang paling relevan dan menarik mengikut kandungan teks," katanya. "Terdapat pelbagai cara untuk mengvisualisasikan dan merekabentuk. Kami melaburkan modal untuk membina kedalaman ini dan meningkatkan kualiti AI."