Jin hates Twitter.
Jin is my friend when I studied in Germany. He loved literary creation when he was still in China. But he never registered any Blog or similar things and only write his artikels with
Long Weibo. For him, this is "the future of literature". After coming to Germany he found that everybody here uses Twitter but not Weibo, but Twitter has no similar function like Long Weibo. 140 charaters are always not enought. Therefore, Jin uninstalled Twitter and he believed that european literature has no future.
I told him that Long Weibo is not something complicated, just converting text into pictures. Maybe I can write an app for you, and the name will be "Big Twitter", and the icon will look like this:
Then it took me two evenings to finish this app. It can convert text into images and instantly send it to Twitter.
But only after half a day Jin came back to me. His picture was blurred and he swears that he had written nothing illegal. I believed in Jin, but why was the picture blurred? It turns out that Jin has written over 8400 words and the image was too big, Twitter has to compress it. So the picture was unreadable. This event completely discouraged Jin, he even removed his Twitter account.
I don't use Twitter often, neither. But as a developer I really interested in it. Twitter has a lot of interesting mechanisms. Today we use Debugger to study the lazy loading mechanism of Twitter.
Some basic concepts
Timeline, the most important module inTwitter. Many tweets combine together to form a long timeline.
Position, the identifier of a tweet. Position of a new tweet is greater than it of an older tweet, therefore I guess position 10000 possibly means "This tweet is the 10000th tweet in the history of Twitter".
Everything starts with "Network"
First we catch a request in Network from Developer Tools. It looks like the following pictures.
Here we can find some thing:
- max_position: We can find a position in the request. And it's the only thing in the request which related to the response content.
- has_more_items: Are there any more tweets in the server or not.
- items_html: content of tweets in HTML format. Twitter uses "Bachend Rendering" mechanism.
- min_postion: Something that has relationship with max_position.
- new_latent_count: How many tweets are there in the response.
Deeper exploration
To explain all these thing, we dive into the code from initiator of the request. And we can find an XMLHttpRequest is sent here. And we believe that there must be some processing function of the response. We can search in call stack and finally we could find the processing function.
Then we keep diving and in the end we find the items_html are added into the timeline.
But how about the min_position and max_position? In the call stack we could find a function called getOldItems. When user scroll down in Timeline for older tweets, this function will be called. And in this function the max_postion in the request will be set with the min_position in the last response.
Then we could summarize the whole process:
- The user scroll down in the timeline. A request will be sent to tell the server: "I have finished reading tweet A, please send me more."
- The server send 20 tweets before A and tell the user: "Here are 20 tweets until tweet B, enjoy!"
- When user these 20 tweets finished reading and scroll down in the timeline, a request will send to the server: "Tweets until B are also finished, please send me more!"
Now always 20?
During the research I found a very strange phenomenen, that the new_latent_count is not always 20. Occasionally it can be a little less than 20. Since in the request there is only the information of max_position, I believe that this number is decided from the server side.
At the beginning I suspect that this number is decided with the size of the response. (If the response will be too large then less tweets will be sent). But in some examples I found that the response size is very small but the new_latent_count is still less than 20. So I guess there might be a magical algorithm. With this algorithm, the server can know how long it takes the user to read a tweet. If the tweets will take a lot of time then fewer tweets will be sent. But this is just my guess. If you know the mechanism please tell me. Thank you!
Deutsch Version
Hallo ich bin Cong. Jetzt bin ich ein Developer an Hybris Revenue Cloud in Chengdu, China. Ich möchte Programmierkenntnisse hier teilen und mein Deutsch verbessern. Deshalb schreibe ich Blogs in Deutsch und Enghlish. Wenn Sie Syntaxfehler finden, oder mein Deutsch ist zu schwer zu verstehen, bitte lesen Sie die English Version und sagen Sie mir den richtigen Ausdruck. Herzlich Dank und ich hoffe, dass Sie meinen Blog genießen. Prost!
Jin hasst Twitter.
Jin ist mein Freund wenn ich in Deutschland studierte. Er liebte literarische Schöpfung wenn er in China war. Aber er hat nie einen Blog oder so etwas geöffnet und nur mit
Long Weibo um Artikel zu schreiben. Für ihn bedeutet es "Zukunft der Literatur". Nachdem er nach Deutschland kam findte er, dass alles hier Twitter aber nicht Weibo benutzen, und Twitter hat keine Funktion wie Long Weibo. 140 Schriftzeichen sind immer nich genug. Deshalb deinstalierte Jin Twitter and glaubte er, dass European Literatur hat keine Zukunft.
Ich sagte ihm, dass Long Weibo ist nicht etwas Kompliziert, nur umwandelt Text in Bild. Da kann ich für dich ein App machen, und der Name is "Groß Twitter", und das Symbol sieht wie diese aus:
Dann habe ich zwei Abende gebraucht um dieses App zu machen. Es kann Text in Bild umwandeln und sofort ein Tweet senden.
Aber nur nach halber Tag kam Jin mich zurück. Sein Bild wurde verwischt und er schwört, dass er nichts Illegales geschrieben hatte. Ich glaubte Jin, aber warum wurde das Bild verwischt? Es stellt sich heraus, dass Jin hat über 8400 wörter geschrieben und das Bild war zu groß, Twitter hat es komprimiert. Dann war das Bild nicht lesbar. Dieses Event machte Jin völlig entmutigt, sogar kündigte er seinen Twitter Konto.
Ich benutze Twitter nich häufig, aber als ein Developer habe ich viel Lust zu er. Twitter hat viele interesant Mechanismus. Heute erforschen wir das "Lazy-Loading" Mechanismus von Twitter mit Debugger.
Einige grundlegende Konzepte
Timeline, das wichtigste Modul von Twitter. Viele Tweets kombinieren zusammen um ein langes Timeline zu bilden.
Position, die Kennung eines Tweet. Position eines neues Tweet ist größer als Position eines altes Tweet, deshalb errate ich, dass Position 10000 bedeutet "Dieses Tweet ist das 10000. Tweet in Geschichte von Twitter".
Alles beginnt mit "Network"
Zum erst nehmen wir ein Request in Network von Developer Tools. Es sieht wie folgendes Bilder aus.
Hier können wir einige Sache finden:
- max_position: Eine Position, da können wir im Request finden.
- has_more_items: Gibt es weiter Tweets im Server oder nicht.
- items_html: Inhalt der Tweets in HTML Format. Twitter benutzt "Bachend-Rendering" Mechanismus.
- min_postion: Etwas hat Beziehung mit max_position.
- new_latent_count: Wie viel Tweets gibt es in dem Response.
Tiefere Exploration
Um diese Sache zu erklären, wir tauchen in die Code von Initiator des Request. Und wir können hier ein XMLHttpRequest finden. Und es muss einige Verarbeitungsfunktions des Response geben. Wir suchen in Call Stack und finden die Verarbeigungsfunktion.
Dann tauchen wir weiter und können wir finden, dass items_html in Timeline hinzufügt wird.
Wo sind min_position und max_position? In Call Stack finden wir ein Funktion nennt getOldItems. Wenn man in Timeline runterscrollen, wird diese Funktion geruft. Es setzt max_position des Request mit min_postion des letztes Response.
Dann wissen wir den Prozess von Lazy-Loading:
- Man runterscrollt in Timeline, ein Request wird gesendet und sagt dem Server: "Ich habe Tweet A gelesen, geben mir die weitere".
- Der Server sendet 20 Tweets und sagt dem Benutzer: "Hier sind Tweets bis B, bitte lesen Sie".
- Wenn man diese 20 Tweet fertig liest und runterscrollt, sagt dem Server: "Alles fertig! Bitte senden mir Tweets bevor B".
Nicht immer 20?
Aber hier gibe es ein seltsames Phänomen, dass new_latent_count ist nicht immer 20. Gelegentlich ist es weniger als 20. Weil in dem Request gibt es nur max_position, glaube ich diese Nummer wird im Server entschieden.
Am anfang vermute ich, diese Nummer wird mit Größe des Response entschieden. Aber in einige Beispiels sind die Größe ziemlich klein und ist die Nummer kleiner als 20. Ich vermute, da gibt es vielleicht ein magischer Algorithmus. Mit diesem Algorithmus kann der Server wissen, wie lange braucht man um ein Tweet zu lesen. Wenn die Tweets braucht sehr viel Zeit dann wenige Tweets werden gesendet. Aber sie ist nur meine Vermutung. Wenn Sie den Mechanismus wissen bitte sagen mir. Danke!
老金是我在德国读书时的好基友,在国内时就酷爱文学创作。但他却从未开通个博客什么的,坚持使用新浪“长微博”功能写文章。用他的话说,这代表新锐文学的姿态。到了德国之后,老金发现人家老外不用微博,人家用Twitter。新锐的他自然要入乡随俗,可正准备舞文弄墨,却发现Twitter里并没有个东西叫“Long Twitter”,140个字符啥也干不了。于是老金愤而卸载Twitter,逢人便感慨西方文学这下是要彻底完了。
时间轴(Time Line),Twitter中最最重要的部分。一条条的推文组合在一起,就成了页面上中间那条长长的时间轴。
- max_position:翻遍Header信息以及请求参数,这是唯一一个跟所要请求的内容相关的东西。具体含义后面再讲。
- has_more_items:顾名思义,服务器通过这个字段告诉前端是否还有更早的内容。
- items_html:格式化之后发现,这个部分就是我们所请求到的推文内容。显然Twitter使用到的是后端渲染的技术,将推文内容渲染好直接发给前端进行展示。
- min_position:恰好对应了请求当中的max_position。
- new_latent_count:这一次所请求到的推文的条数。
为了搞清楚这些信息到底是怎么回事,我们通过寻找请求的发起者来深入到代码当中。原来Twitter在这里发送了一个XMLHttpRequest。无论是什么请求,总归要有一个处理的方法,我们在Call Stack中层层向上追溯,然后找到了请求的定义位置。
- 用户向下滚动时间轴,发出请求,通知服务器“我已经把第A条看完啦,快让我看更之前的内容”。
- 服务器返回从A再往前的20条内容,并告诉用户“喏,现在发给你直到第B条的所有内容了,慢慢看吧”。
- 用户再次看完这些内容,向下滚动时间轴,告诉服务器“到第B条的我也看完啦,B之前的你再发给我吧”。