Arts Universe and Philology

Arts Universe and Philology
The blog "Art, Universe, and Philology" is an online platform dedicated to the promotion and exploration of art, science, and philology. Its owner, Konstantinos Vakouftsis, shares his thoughts, analyses, and passion for culture, the universe, and literature with his readers.

Τρίτη 8 Ιουλίου 2014

Ο άνθρωπος «χωράει» σε ένα DVD. How many gigabytes does it take to make a human?

Ο όγκος των πληροφοριών που «φτιάχνουν» έναν άνθρωπο είναι μόλις 1,5 GB και χωράει άνετα σε ένα DVD, όπως υπολόγισε το Veritasium, κανάλι εκλαΐκευσης της επιστήμης στο YouTube. Human genetic code is contained in a sequence of four molecules, represented by letters A, T, G and C. Each can be encoded with two bits of binary information - 00, 10, 11, 01. When multiplied by 6 billion letters, and divided by eight bits per byte, a physician claims the entire code contains just 1.5GB of data.

Τι νομίζετε ότι περιέχει περισσότερες πληροφορίες, το DNA που συνθέτει τον οργανισμό μας ή όλα τα ψηφιακά δεδομένα που υπάρχουν στη Γη; Το ερώτημα δεν τέθηκε από εμάς αλλά από τον Ντέρεκ Μίλερ, φυσικό ο οποίος έχει γίνει διάσημος ανά την υφήλιο εκλαϊκεύοντας επιστημονικά θέματα μέσω του διαδικτυακού καναλιού Veritasium που έχει δημιουργήσει στο YouTube.

We, humans, share almost all the genetic code with every other human being on this planet. The total information in the DNA that makes us, well US, can be stored on a floppy-disk, in about 1.5MB of information. That is the amount of information that is DIFFERENT from human to human. The total information contained in the DNA is about 1.5 GB. Can you imagine? 1.5 Gb of information in a 2 meter long strand of acid (that what the DNA is) that is trapped inside a cell’s nucleus. From 100 000 genes that could be located in the DNA it seems that only about 19 000 are protein generating genes, but that is a story for other times. In any case, in regards to information, even though some languages make you speak very quickly, the same quantity of information is sent to the listeners in the same time in any language. The total information in all our cells amounts to about 60 zettabytes meaning more than all the information that the humanity will create until 2020.

Ο κ. Μίλερ δεν θέτει απλώς τα ερωτήματα, φροντίζει επίσης να τα απαντά – και αυτό ακριβώς έσπευσε να κάνει και σε αυτή την περίπτωση. Όπως υπολόγισε εφαρμόζοντας τη θεωρία της πληροφορίας στο ανθρώπινο γενετικό υλικό, τα δεδομένα που απαιτούνται για να συνθέσουν τον καθένα από εμάς είναι μόλις… 1,5 GB – ωχριούν δηλαδή μπροστά στην ψηφιακή κληρονομιά του πλανήτη αφού μπορούν να χωρέσουν άνετα σε ένα απλό DVD.

Δυαδικό ζωτικό σύστημα 

Unlike the two protein coding genes shown (top, middle), the gene ACO074091.13 (below) is predicted to produce no protein and is likely to be removed along with an additional 1,700 genes that are currently in the human genome annotation. Credit: CNIO

Προκειμένου να ποσοτικοποιήσει τα ανθρώπινα γενετικά δεδομένα ο κ. Μίλερ  «διάβασε» τα γράμματα του DNA με οδηγό τη θεωρία των πληροφοριών και το δυαδικό σύστημα. Όπως εξηγεί στο σχετικό βίντεό του, η μικρότερη ποσότητα πληροφορίας που μπορούμε να έχουμε είναι ένα απλό «ναι» ή «όχι» _ ή αντίστοιχα «κορώνα» ή «γράμματα» κ.ο.κ. – τα οποία στο δυαδικό σύστημα μπορούν να «μεταφραστούν» αντίστοιχα σε 1 και 0. Το κάθε ψηφίο του δυαδικού συστήματος αντιστοιχεί σε 1 bit πληροφοριών. Tο 1963, «ψηφιοποιώντας» ολόκληρο το αγγλικό αλφάβητο, με τους πεζούς και κεφαλαίους χαρακτήρες συν τα σημεία στίξης, στον Αμερικανικό Πρότυπο Κώδικα για την Ανταλλαγή Πληροφοριών – American Standard Code for Information Interchange, πιο γνωστός ως ASCII  -  οι ειδικοί είδαν ότι για να κωδικοποιηθεί χρειάζονται 7 bits. Οι ηλεκτρονικοί υπολογιστές όμως για να λειτουργήσουν χρειάζονται ως βάση έναν ζυγό αριθμο, γι’ αυτό και χρησιμοποιούν ως υπολογιστική μονάδα τα 8 bits, τα οποία και ονομάστηκαν 1 byte (η επιλογή του «y» όπως τονίζει ο επιστήμονας είναι εσκεμμένη προκειμένου να μην υπάρχουν «παρεξηγήσεις» ανάμεσα στις δυο μονάδες).

Ο γενετικός κώδικάς μας είναι «γραμμένος» σε μια αλληλουχία τεσσάρων χημικών βάσεων οι οποίες αναπαρίστανται με τέσσερα γράμματα – A, T, G και C. Το καθένα από αυτά μπορεί να κωδικοποιηθεί με 2 bits πληροφοριών – 00. 10. 11. 01. Αν πολλαπλασιάσουμε αυτόν τον αριθμό επί 6 δισεκατομμύρια (3 δισ. ζεύγη βάσεων) που είναι ο αριθμός των γραμμάτων που περιέχει το γονιδίωμά μας και στη συνέχεια τον διαιρέσουμε διά 8 για να εξαγάγουμε τον αριθμό των bytes ο κ. Μίλερ υπολόγισε ότι ολόκληρος ο γενετικός μας κώδικας περιέχει μόλις 1,5 GB. Όπως επισημαίνει, αυτός ο όγκος πληροφοριών μπορεί να αποθηκευθεί σε ένα κοινό DVD (και να περισσέψει και χώρος) ενώ αντιστοιχεί περίπου σε 1.204 ηλεκτρονικά βιβλία (αν υπολογίσουμε ένα βιβλίο στο 1,4 MB) ή σε 512 ψηφιακές φωτογραφίες (αν υπολογίσουμε την κάθε φωτογραφία στα 3 MB).

Στην πραγματικότητα όμως η ποσότητα της πληροφορίας είναι μικρότερη από 1,5 Gigabyte, αφού οι 6 δισεκατομμύρια βάσεις του DNA συνδέονται σε ζευγάρια με συγκεκριμένο τρόπο, έτσι ώστε αν κανείς γνωρίζει τη μία βάση του ζεύγους γνωρίζει και την άλλη. Αυτό σημαίνει ότι η γενετική πληροφορία είναι το μισό, περίπου 750 Megabyte.

Η μοναδικότητά μας σε μια δισκέτα

Furthermore, because 99.9 per cent of this information is shared with other humans, less than one part in a 1,000 is unique - and this small amount of data could easily fit on a floppy disk (stock image pictured).

Μετά τον υπολογισμό του όγκου δεδομένων του γενετικού μας κώδικα ο κ. Μίλερ περνάει στην «ποσοτικοποίηση» των δεδομένων που περιλαμβάνει ολόκληρος ο οργανισμός μας. Κάθε κύτταρό μας περιέχει ένα πλήρες αντίγραφο του γενετικού μας κώδικα (δηλ. 1,5 GB πληροφοριών) και ολόκληρο το σώμα μας αποτελείται από 40 τρισεκατομμύρια κύτταρα: το γινόμενο ισούται με 60 zettabytes δεδομένων, γεγονός το οποίο σημαίνει ότι «τρέχουμε» πληροφορίες 60.000.000.000.000.000.000.000 bytes (όγκος δεδομένων μεγαλύτερος από τα 40 zetabytes που εκτιμάται ότι θα φθάσουν όλες οι ψηφιακές πληροφορίες του πλανήτη το έτος 2020).

Όλος αυτός ο όγκος δεδομένων δεν είναι όμως «προσωπικός». Το 99,9% των γενετικών πληροφοριών είναι κοινό σε όλους τους ανθρώπους, πράγμα το οποίο σημαίνει ότι αυτό που καθιστά μοναδικό τον καθένα από εμάς συρρικνώνεται δραματικά: «πέφτει» αρκετά κάτω από το 1 MB και θα μπορούσε να αποθηκευθεί σε μια από τις παλιές δισκέτες που σήμερα οδεύουν προς το… μουσείο.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου